Telegram Web Link
Есть только одна вещь в мире больше, чем скорость и масштаб развития ИИ — это человечная глупость и инертность.

С одной стороны стоят те, кто ждут Конца Экономики. Конец затронет только кожаных и только тех, кто не является собственником средств производства роботов и нейронок. Но вторые смогу нормально существовать только пока для этого производства нужны будут кожаные руки и белковые мозги (то есть, совсем недолго). Все что вы сделаете или заработаете в ближайшие пару лет — это то, с чем вы останетесь доживать жизнь. Плюс, бесплатная подписка на порно-метавселенную и базовый доход от очередной партии коммунистов или гигакорпорации, которая будет в тот момент самой популистской среди биомасс.

С другой стороны, до сих пор встречаются те, у кого «а ничего же не случилось». Верстают бюджеты на пять лет вперед, нанимают Джунов-юристов и копирайтеров, планируют привлекать деньги под «новую темку с ИИ и блокчейном». В их мире все еще держится на каких-то мифических связях и interpersonal skills. Ждут понижения ставок ФРС. И прочими способами активно сигнализируют, что нас-то это не коснется. Что людям все равно будет нужно то, что они делают.

И то, и другое показывает, что детский максимализм это проигрышная стратегия. Но вот взрослой, то бишь разумной, никто пока предложить не смог.
Первая ласточка в области применения рекурсивного самоулучшения к языковым моделям. Пока это относится в основном к коду, который используется для вызова LLM, но идея очень интересная. По ссылке можно почитать обзор разных подходов к рекурсивной оптимизации и улучшению ИИ систем.

Работает так:
1. Пользователь закладывает цель в систему
2. LLM многократно промтит сама себя и генерирует код для решения задачи
3. Выбирает лучшие из получившихся решений
4. Оценивает эффективность
5. Запускает новый раунд "самоулучшения", и так пока не дойдет до заданного лимита итераций

Это пока сыроватая, но крайне мощная идея. Куда интереснее будет, когда самоулучшаться начнет сама нейронка или даже её архитектура. Вот будет весело: если человекам дойти от GPT-3 до GPT-4 нужен год, но нейронке (given enough compute) на такой же скачок производительности вполне может хватить 500 миллисекунд.

P.S. Сегодня будет вебинар про то как делать enterprise-ready (корпоративных, бизнесовых) ИИ агентов с вашими данными. Будет много про кейсы использования, архитектуру и конкретные лайфхаки реализации. Регистрация в луме — https://lu.ma/codextown — или в Boosty.
Тут посмотрите что подвезли.

Я вообще был жутко скептически настроен в плане наличия адекватного контента про ИИ в русском телеграме, но у Сергея просто чумовой канал. Он невероятно крут в повествовании и идеях. Абсолютно заслуженный лидер среди всех каналов про ИИ. Даже не хуже твиттера!
​​«Ловушка Гудхарта» для AGI
«Революция ChatGPT», которая произошла в 2023, резко сократила прогнозные оценки экспертов сроков, отделяющих нас от создания искусственного интеллекта, ни в чем интеллектуально не уступающего никому из людей (AGI). При этом, как это ни парадоксально, но существующие методы тестирования пока не способны хоть с какой-то достоверностью диагностировать достижение ИИ-системами уровня AGI. В настоящей работе обсуждается вопрос преодоления проблемы несовершенства современных способов тестирования ИИ-систем. В частности, излагается гипотеза о принципиальной невозможности решения проблемы обнаружения AGI, как с помощью психометрических тестов, так и методов оценки способности машин имитировать ответы людей, из-за так называемой «ловушки Гудхарта» для AGI. Рассмотрен ряд предложений по обходу «ловушки Гудхарта» для AGI способами, предлагаемыми в новейших исследовательских работах, с учетом первых результатов произошедшей «революции ChatGPT». В последней части статьи сформулирована связка из трех эвристических гипотез, позволяющих, в случае их верности, кардинально решить проблему «ловушки Гудхарта» для AGI и тем самым стать геймченджером на пути создания AGI.

Этот текст - аннотация моего нового лонгрида “«Ловушка Гудхарта» для AGI: проблема сравнительного анализа искусственного интеллекта и интеллекта человека“. Он родился в результате моей попытки более строго и методичного анализа вопросов, рассмотрение которых было начато в предыдущем лонгриде «Фиаско 2023». Итогом стал лонглонгрид со списком ссылок в 50+ работ. И потому местом его публикации на сей раз стал журнал “Ученые записки Института психологии Российской академии наук“.

Что может мотивировать читателя на получасовое чтение статьи о бесперспективности большинства существующих подходов к тестированию ИИ и о гипотезе возможного выхода из этого тупика?

Помимо чисто исследовательского любопытства, такой мотивацией могло бы стать понимание следующей логики из трех пунктов.
1. Направления и методы дальнейшего развития технологий ИИ будут в значительной мере определяться национальным и глобальным регулированием разработок и внедрения систем ИИ.
2. Ключевым компонентом такого регулирования станет оценка когнитивных и мыслительных способностей новых систем ИИ.
3. Иными способами оценки, чем экспериментальное тестирование, современная наука не располагает.

И если эта логика верна – вопрос о способах тестирования ИИ систем, позволяющих достоверно фиксировать приближение их интеллектуального уровня к AGI, становится важнейшим вопросом для человечества.
А раз так, то может стоит на него потратить целых полчаса вашего времени?

#ИИ #AGI #Вызовы21века
Делаю большую 3-часовую презентацию / сценарий для серии YouTube роликов про практическое использование ИИ в реальной жизни. Цель — вести максимально актуальный список хаков, идей, кейсов, практик применения LLM с упором на продуктивность и качество жизни.

Каждый день в общении с друзьями и знакомыми я встречаю какие-то новые классные хаки. Причём, чаще всего люди не из ML/AI сферы придумывают самые неожиданные решения, просто потому что у них нет внутренних ограничений относительно того на что способен GPT.

Призываю вас делиться идеями, практиками, промтами в комментариях. Для затравки несколько моих примеров:

1. Использую голосовой формат GPT каждое утро для составления to-do списка на день. GPT знает контекст всех моих задач и статус из выполнения в предыдущие дни (потому что все это в одном чате) и предлагает для каждой задачи способ её решения. Допустим, если задача "написать письмо Ване", то GPT сразу в to-do листе напишет примерный текст.

2. Custom instructions. Первое что я туда добавляю это всегда "be concise & blunt with your responses" чтобы он рубил правду-матку с плеча. Но теперь еще экспериментирую с добавлением туда задачи для GPT быть коучем и имена конкретных исторических персон чей стиль или философия были бы полезны в ответах (Feynman, Wilber, etc.)

3. Poor's man chain-of-density. Цепочка плотности бедняка. Найденный в твиттере промт, который помогает GPT 2 раза переписывать текст в стиле определенного человека, параллельно критикуя свою работу и исправляя её. Вот промт + пример. Идея CoD описана тут.

Пишите ваши примеры, идеи, хаки. Обязательно проверенные в реальной жизни, но из любой области: от личной терапии до бизнеса, от творчества до развлечения на вечеринках. Укажу ссылку на вас в ролике и презентации, если хотите.
Выложил запись вебинара «ИИ для корпораций и бизнеса». Я разобрал 15+ лучших практик внедрения генеративного ИИ в бизнес-процессы или для создания продуктов для работы над вашими данными. Мы обсудили в чем недостаток LLM в чистом виде, как решить эти проблемы с помощью добавления ваших корпоративных или персональных данных в ИИ. Мы поговорили почему наивная реализация этой идеи довольно плохо работает. Разобрали 15+ хаков и практик улучшения генерации ответов на основе ваших данных. Поговорили о бизнес-кейсах для продуктов, бек-офиса и личной продуктивности. Вебинар не технический, но я постарался дать как можно больше конкретики, ссылок на продукты, гайды, туториалы, чтобы это можно было реализовать самостоятельно.

Презентация, запись лекции и серии вопросов и ответов доступна последним постом в Boosty. Кстати, на этой неделе запускается наше закрытое сообщество с чатом, еженедельными встречами, мини-группами и базой полезного контента. Расскажите, интересно ли вам в таком поучаствовать и что вы от него ожидаете?
Вчера написал а потом стёр пост про трейдинг. Потому что там глубокого инсайта не было, а только эмоции. Но у меня всё ещё болит.

Хочу поговорить об этичном бизнесе. Бывает ли такое? Нужно ли пытаться поженить ежа (максимизацию прибыли) и ужа (ценности)? Почему у некоторых это болит (я продаю скам и страдаю), а другим в кайф (я богатею и радуюсь)? И где мы с вами в этой борьбе?

Речь не только о госконтрактах, наркотиках и оружии. Например, я считаю большую часть трейдинга и эдтеха крайне неэтичным бизнесом.

Инвестиции, за исключением инфраструктуры (брокеры, биржи, индексы) или крайне крутые фонды (VC, PE, quant), — это (как кто-то верно заметил в комментариях, сорри, стер и забыл имя) придумывание новых игр и развлечений для хомяка. Для иррациональных, верящих в удачу и технический анализ для второклассников лудоманов. Вот вам бинарные опционы. Звучит умнО, а значит никто не подумает что скам. А вот новейшая супер-технология, мемкоины и NFT. А вот портфельный управляющий, почти что HNWI с положительным ROI на pre-IPO synthetic assets, благодаря сэкономленным деньгам со школьных обедов.

Итого: инвестиции легко продавать, потому что ты обещаешь сделать клиента богатым. А он, пусть и знает что чудес не бывает, но очень хочет верить…

Эдтех это еще хуже. Там продается не только богатство, но успех, ум, статус. Я много работал в образовании и пока еще не нашел примеров, где платное образование было бы лучше публично доступного. Исключение — сообщество. HBS и GSB это не послушать лекцию Билла Гейтса, а про алумнай тусовку и открытые двери, благодаря бренду (который Harvard и Stanford поддерживают не столько качеством учебы, но строгостью отбора). Ну и профессии где практика руками необходима: хирурги, дантисты, пианисты.

Любое образование онлайн — это продажа вам вашей собственной лени. Ни одна онлайн школа не предоставляет более качественный материал, где тот, что доступен на ютубе, в твиттере или на кворе. Но их задача не учить, а собрать с вас дань. Потому что вы им платите за то что вам лень ботать самому или, чаще, за вашу неуверенность в себе. Вы могли бы заботать, но не считаете себя достаточно талантливым или достойным.

Эта критика, кстати, относится и ко мне самому. Codex.town (наши вебинары и закрытое сообщество) — это до какой-то степени образование, но я пытаюсь это делать так, чтобы не держать слушателей за идиотов и строить общение на равных. Хотя… смотря на некоторые другие продукты по ИИ-образованию, понимаешь, что можно качество снизить, а цену поднять в 10 раз и всё равно это будет на уровне рынка. Но это скорее временный арбитраж, чем возможность.

А вы за этику или за баблос? Или против ложных дихотомий? Что чувствуете?
Новое демо GPT-4V (мультимодальный GPT)

Вчера в СФ прошла конференция про генеративный ИИ. Куча анонсов, мощных идей, умных людей. OpenAI, понятное дело, рассказывали о своих новых мультимодальных моделях. И показали несколько, раньше не опубликованных, демо. Хочу поделиться ими с вами.

Демка, которая по их заверениям занимает несколько десятков строчек кода, берет видео с ютуба и делает несколько простых, но совместно очень ценных действий:

1. Whisper транскрибирует длинное видео
2. GPT-V анализирует каждый фрейм видео и делает эмбеддинг обьектов из видео
3. GPT-4 пишет блог пост по теме видео
4. И, наконец, DALL-E берет эмбединги видео и генерирует слайды к каждой секции поста, которые графически и текстом представляют основную идею.

Прикрепляю пример результата, который так же можно посмотреть тут. Ключевая фишка в том, что этот результат получен не каким-то сложным специализированным приложением, а несколькими вызовами OpenAI API.

Так что представьте себе что мы сможем сделать через 6-12 месяцев, когда весь мир и лучшие компании этого мира получат доступ к API.
Опубликовал новое видео про сервис, которые позволяет за $0.1 (а для вас — бесплатно) сделать уже не просто примитивный вебсайт, а реально работающий, пусть и несложный, MVP. MAGE позволяет на основании одного промта сгенерировать веб-сайт с авторизацией, произвольной логикой, терпимым дизайном и базой данных, а так же сразу задеплоить его для публичного доступа.

Это все ещё можно отнести к категории демо, но мой проект с первого раза заработал без ошибок и имел неплохой функционал. В видео показываю пример и рассказываю как именно работает инструмент.

Помните, пару месяцев назад gpt мог сгенерировать пустую страницу без логики и с ультра-базовым дизайном. С тех пор прогресс примерно как +6 месяцев опыта у программиста. И это при том, что базовая модель осталась той же — изменилась только архитектура агентской системы поверх. Скоро у нас будет универсальный ИИ-джун, а через Х лет писать код руками будет вообще бессмысленно (кроме как для развлечения).
Github CoPilot, самый успешный продукт в генеративном ИИ на сегодняшний день, преодолел $100M ARR: 50% всего кода на гитхабе написано с помощью копайлота, больше 1М платящих пользователей (среди них 20 тыс корпоративных клиентов) и ~55% прирост скорости производительности разработчика (по их внутренней оценке). Несколько месяцев назад они перешли со специализированной модели Codex (не Town) на общую gpt-3.5-instruct, что сделало продукт еще быстрее.

В продолжение темы генерации кода, пару мыслей от CPO Github:

— в ближайшем будущем от модели описания функций и процедур в коде, мы перейдем к модели "цели и ограничения": задачей инженера будет описать (голосом, текстом, json'ом) цели приложения и существующие ограничения (использовать typescript, хостить на AWS, деплоить через k8s)

— RAG и визуализации. Гитхаб будет искать за вас нужные места в архитектуре приложения и генерировать правильные запросы или даже промты к самому себе. А для пользователя это будет что-то вроде интерфейса с кучей слайдеров по уровню или наличию функционала.

Важное дополнение, что CoPilot это хоть и крутой, но очень общий продукт. Я видел куда более крутые решения специализированные на анализе PR, написании тестов, ревью кода на безопасность.

Даже если вы не программист, то все равно призываю вас задуматься о том как это изменит процессы, косты и скорость выполнения любых технических задач в вашей области деятельности.

Кстати, Gen AI меняет мир. Чтобы оставаться на волне этого тренда, вступайте в сообщество и подписывайтесь на лекции/воркшопы codex.town
Сегодня хочу рассказать вам о самых крутых практиках дизайна систем с искусственным интеллектом.

Мир меняется, вместе с ним меняются технические возможности, но привычки и поведение людей остаётся более-менее тем же.

Язык — это самая естественная для нас форма коммуникации, и именно поэтому ChatGPT и аналогичные продукты получили сотни миллионов пользователей на первые месяцы своего существования. Но я не верю, что чат — это максимум, на который мы способны. Сегодня я хочу разобрать интересные практики дизайна интеллектуальных систем созданных изначально под LLM.

Масштаб и детализация

Информация иерархична, а интерфейсы статичны. Представьте себе текст со слайдером. Вы читаете полный текст статьи, но, отдалив слайдер, теперь каждый абзац представлен одной фразой. Отдаляете еще — и теперь каждая секция это одна сточка. Отдаляете на максимум и видите супер-краткое саммари текста.

А теперь берём эту идею и перекладываем на другие интерфейсы: работа с таблицами, поиск информации, создание презентаций, аналитика рекламных кампаний. ИИ — это универсальный саммаризатор, который может поднимать и опускать вас именно на тот уровень деталей и абстракции, которые нужны для решения текущей задачи.

Мультимодальность и адаптивность

Модальности ввода и вывода не должны конкурировать друг с другом. Текст не более удобен, чем голос, или наоборот. Модальности должны адаптироваться под удобный в конкретный момент способ коммуникации. Я люблю во время прогулки рассказывать свои идеи GPT и просить их покритиковать. Но, работая за монитором или сидя в кафе, мне удобнее печатать. По этой ссылке вы найдете демо LLM-приложения, которое использует камеру и, в зависимости от того насколько вы далеко от компьютера, переключается между текстовым и голосовым вводом и выводом.

Жесты

Жесты — это значительная часть успеха смартфонов и многих других продуктов Apple. Будь то тач скрин, VR, даже ускорение или замедление шага — LLM уже сегодня в состоянии интерпретировать такие действия и вызывать соответствующего агента или функцию.

Эмоции

Люди общаются эмоциями не меньше чем семантикой. LLM очень круто (по моим тестам, лучше большинства людей) умеют выделять эмоции из текста. Модели, которые считывают эмоции по выражению лица или голосу, существуют уже давно. Адаптировать действия, тон речи под эмоциональное состояние пользователя станет нормой в дизайне AI систем.
Новый формат: ИИ-радио!

На следующей неделе во вторник на канале Gershuni пройдет прямой эфир со Степаном Гершуни и Сергеем Цыпцыным, автором Метаверсище и ИИще, на тему “Как ИИ меняет мир?

Мы поговорим о том как стремительное развитие генеративного ИИ влияет на различные области жизни и экономики:

- Что такое образование в эпоху ИИ и какие навыки теперь в цене? Что такое базовая грамотность в век ИИ?
- На что обращать внимание при изучении ИИ: промты, курсы, инфопродукты. Как сэкономить и не попасться на инфоцыгнщину?
- Как сделать так, чтобы ИИ не уничтожил нас всех? Алаймент — это страшилки или реальная опасность? ИИ — это Бог, а Илья Суцкевер его пророк?
- Как выбрать, использовать и выжать максимум из ИИ-ассистентов и агентов?
- Что делать бизнесу в эру ИИ-хаоса? Куда бежать или, может, наоборот, успокоиться?
- Что там в диффузионках? Когда уже мы сможем генерировать “Аватар - 5” одним промтом через Apple Watch?
- Мультимодалки, тренировка своих моделей, open source vs prorietary и другие темы
- Так же ответим на вопросы аудитории, если уложимся в тайминг

Степан — исследователь, технологический стратег, серийный фаундер, работает (набегами) с NLP/ML с 2012 года. Ведущий вебинаров codex.town
Сергей — эксперт в области компьютерной графики, автор книги "Понимая Майя", исследователь искусственного интеллекта, ведущий экзистенциального канала Метаверсище и ИИще.

Подключиться к прямому эфиру можно во вторник, 17 октября, в 11am ET / 15pm UTC / 17pm CET / 18pm MSK прямо в телеграме в канале Gershuni. Чтобы не пропустить, можно регистрироваться тут.
Сплетая нейронные сети,
Мы цепи из блоков куём.
Паутины всемирной мы дети;
Социальные сети — наш дом.

Субботнее
Политического срача пост

Либералы побеждают в хорошие времена, потому что людям ценно качество жизни, свобода, инклюзивность.

Консерваторы побеждают в тяжелые времена, потому что людям важнее жесткий контроль, сильная армия, единение, патриотизм.

Но есть одна партия, которая будет набирать голоса что бы в мире ни происходило. Это партия Голема. Ока Бога. Блейдраннера. Тех, кто считает что люди не умеют и уже не научатся принимать адекватных решений.

UPD. В комментариях придумали название этой партии: "AltMan — альтернатива человеку"
А вот что выкатили в ChatGPT за выходные (теперь уже для всех пользователей):

1. GPT-4V, вы можете загружать картинки, схемы, графики, фотографии как часть промта. Подробнее писал вот тут.

2. DALL-E 3, который позволяет генерировать неограниченное количество картинок прямо в чате. В принципе все то же самое, что SD или Midjourney, но с утроенной цензурой и умеет писать текст.

3. «Голосовые беседы» в мобильном приложении. Это отличается от ввода промта голосом тем, что GPT тоже отвечает голосом и по всем внешним признакам это ближе всего к телефонному разговору. Ходишь часами по дому и разговариваешь с ним на любые темы. Или сидишь за компьютером в наушниках и просто делишься всеми мыслями, а она их послушно записывает, анализирует, критикует.

Я продолжу писать о хаках и ньюансах этих продуктов, а пока немного поразительный для меня лично пример (на картинках выше). Загрузил в GPT фотографию задачи по линейной алгебре, тот перевел её в код, а Data Analytics чат решил задачу. Ответ, на удивление, верный. А картинка, мягко говоря, интересная.
Напоминаю, что через ~4 часа начнется прямой эфир на тему "Как ИИ меняет мир?". Для подключения просто переходите по ссылке на канал Gershuni. Ваши вопросы можете писать в комментариях прямо под этим постом.
Live stream scheduled for
Live stream started
2024/10/03 21:31:29
Back to Top
HTML Embed Code: