Telegram Web Link
Сделать ИИ-агент с долгосрочной памятью, без программирования? Легко!

В эту пятницу на очередном (12-ом) вебинаре я покажу вам как сделать ИИ-приложение, которое умеет записывать новые знания в долгосрочную память и отвечать пользователю на основе именно этих знаний. Я покажу как делать это без единой строчки кода и таким образом, что ваш босс/клиент/жена/кот смогут в дальнейшем менять, адаптировать и улучшать приложения без каких-либо технических навыков.

Вам хотелось чтобы ChatGPT давал более конкретные ответы и ссылался бы на источник? Чтобы бот отвечал именно так, как вы его заранее "обучили"? Чтобы для сотрудника технической поддержки выдавалась сразу цитата из документации? Чтобы маркетинговые тексты аккуратно и точно показывали хар-ки продукта? Чтобы ваш личный ассистент отвечал по вашей собственной базе знаний, а не придумывал от себя?

Я покажу как это сделать используя исключительно публично и бесплатно доступные инструменты. Так же расскажу как использовать всю мощь LangChain через no-code платформы и как бесплатно эти платформы захостить. (Грубо говоря, как за $5-7/мес получить функционал, который StackAI продает за $900/мес)

Почти все практические юзкейсы генеративного ИИ включают в себя тот или иной способ дообучения, тьюнинга и чейнинга (соединения одной или нескольких LLM в сеть агентов, которые образуют мыслительный процесс). И подход, про который я расскажу в пятницу является самым простым, удобным даже для нетехнарей способом это сделать.

Вебинар доступен для подписчиков Boosty (любого уровня) или для тех, кто зарегистрировался в Luma. Исходный код, инструкция и запись воркшопа пришлю всем кто зарегистрирован или подписался в бусти. Начало в 4pm London / 6pm Moscow / 11am NY.
Media is too big
VIEW IN TELEGRAM
Только ленивый не написал о выходе DALL-E 3, новой диффузионной модели от OpenAI. В нашем последнем вебинаре мы как раз разбирали как работают такого рода модели.

Из плюсов:
- встроено в чат
- умеет текст и надписи
- классная стилизация
- все это можно будет встраивать через API (сгенерируй модель атома для урока химии, нарисуй лого на этом слайде)

Из минусов:
- непонятно насколько она хороша с лицами и людьми
- OpenAI серьезно восприняли вой на тему «я художник, это мой стиль» и теперь там будет копирайт-холокост и цензура

В течении ближайшего месяца будет доступно для всех пользователей ChatGPT Plus. А значит ваши промты, рабочие воркфлоу и чаты смогу генерировать умопомрачительный графон. Про DALL-E еще сделаем отдельный вебинар.

А в эту пятницу, напомню, будем говорить про создание цепочек ИИ-агентов с доступом к долговременной памяти, подключением к сайту или телеграмм-боту. Будет практический воркшоп. И все это через no-code. Вебинар доступен для подписчиков Boosty (любого уровня) или для тех, кто зарегистрировался в Luma.
This media is not supported in your browser
VIEW IN TELEGRAM
Можно вечно смотреть как бот подается на вакансии. Если ваши рекрутеры все ещё кожаные, то вас ждут тяжелые времена ;)

Этот скрипт считывает вакансию, сопоставляет её c резюме и заполняет вопросы и сопроводительные письма, где это требуется, индивидуальными ответами в стиле аппликанта.
Пишу сценарий по использованию LLM с долгосрочной памятью для завтрашего воркшопа. Все ещё принимаются идеи от вас, но с нуля создать и объяснить как это работает смогу только один полноценный сценарий.

— пользователь (админ) загружает документ (в моем случае, один — MiCA, регуляция криптоактивов в ЕС на 150 страниц; второй — подборка медицинских исследований о действии пептидов на организм)
— LLM генерирует список часто задаваемых вопросов по этому документу
— задав конкретный вопрос, конечный пользователь получает подробный ответ со ссылками на источники в документе
— пользователь может попросить перефорулировать каждый ответ одной кнопкой. например, упросить и написать понятным языком
— как бонус: показать как встроить такую систему в телеграм-бот, веб-сайт или Whatsapp
— конечно же, всё через no-code решения

Вебинар доступен для подписчиков Boosty (любого уровня) или для тех, кто зарегистрировался в Luma. Исходный код, инструкция и запись воркшопа пришлю всем кто зарегистрирован или подписался в Boosty. Начало в 4pm London / 6pm Moscow / 11am NY.
Media is too big
VIEW IN TELEGRAM
Как я и предсказывал, крупные продукты начинают внедрять ИИ функционал почти что в каждую кнопку. Следующий апдейт Windows включает в себя полноценный copilot для всей операционной системы, который будет встроен в приложения от Paint и Notepad до вполне ожидаемых PowerPoint и Excel. Bing Chat будет включать в себя полную и бесплатную версию GPT-4 + DALL-E 3.

На видео показано как Copilot из текстового документа пишет и рисует презентацию. Красота. И абсолютно неизбежно, потому что создание презентаций — это, кажется, самый бессмысленный труд офисных работников.

Ну и, конечно, теперь Word может писать документы по вашим тезисам, а Эксель — считать P&L по вашим вводным.
Media is too big
VIEW IN TELEGRAM
Ну и маркетинговый ролик для полного погружения
Сегодня (3pm UTC) вебинар-воркшоп про создание цепочек ИИ-агентов для работы с долговременной памятью и саморефлексии ботов. Все это с помощью no-code.

Воркшоп и его запись будут доступны для подписчиков Boosty или для тех, кто зарегистрировался в Luma. Исходный код, инструкция и запись воркшопа пришлю всем кто зарегистрирован или подписался в Boosty. Начало в 4pm London / 6pm Moscow / 11am NY.
Пишу этот пост. Просто чтобы он навсегда остался в "закрепленных"
e/acc pinned a photo
Please open Telegram to view this post
VIEW IN TELEGRAM
В тему ИИ как Великого Уравнителя. Я каждый день вижу примеры когда люди благодаря генеративным нейронкам могут делать вещи, к которым раньше они даже не знали с какой стороны подступаться.

У меня есть знакомый, который ни разу в жизни не программировал, а тут, на пенсии, с помощью GPT сделал рабочее приложение для телефона. Или любой кто пишет пост, книгу, презентацию и теперь может бесплатно сгенерировать графику на уровне топ-10% лучших иллюстраторов мира. Или, подписывая контракт, получить анализ договора от Claude на уровне не хуже среднего юрист (но бесплатно, а не за $200). И школьник, которому ИИ объясняет сложную тему (делая её не только сложной, но интересной) с персональным подходом, эмпатией, чистотой объяснения и кастомно сгенерированными графиками и схемами на уровне топ-10% педагогов мира. А заскучавшие школьники генерируют action сцены на уровне средненького боевика с десятимиллионным бюджетом.

В каждом моём дне таких примеров десятки: саммари звонков, редактура текстов, анализ юридических документов, изучение фармакокинетики (для одного проекта), написание и анализ кода на почти незнакомом языке.

Это сегодня. А ведь еще ничего толком не началось. Да, формально, у ИИ-продуктов уже под миллиард пользователей (Bing, GPT, Opera, etc). Но реальных power users, которые почувствовали на себе эту силу Великого Уравнения, по моим скромным оценкам, все ещё только десятки тысяч.

Нас ждут великие приключения и великие потрясения.
Еще примеры и исследования на тему влияния ИИ на продуктивность людей и разделение труда. Спойлер: они все подтвреждают тезис о великом уравнении.

1. Исследование MIT почти 500 сотрудников, чья работа в основном состоит из написания текстов показало, что GPT существенно снижает разницу в качестве работы между сильными и менее опытными или талантливыми сотрудниками. При этом GPT больше заменяет усилия работников, чем дополняет их навыки.

2. Исследование показывает, что доступ к генеративному ИИ повышает творческий потенциал людей при написании коротких рассказов, особенно у менее креативных авторов, но в то же время приводит к снижению уникальности и разнообразия создаваемого контента.

3. Эксперимент оценивающий влияние помощи ИИ на юридическое мышление: студенты сдавали экзамены по праву с помощью GPT-4 и без неё. Оказалось, что худшие студенты выигрывали больше всего от ИИ, а лучшие - теряли.

4. Исследование более чем 5,000 сотрудников тех поддержки использующих генеративный ИИ. Худшие агенты техподдержки и новички только вышедшие на работу показали максимальный прирост результата. Так же сильно улучшилась оценка качества решения проблемы со стороны клиента.

Меня всегда в любом бизнесе (особенно, крупном) поражало количество тупой и бесполезной работы. Очень для многих ролей это было близко к 100%. Теперь эта проблема решена: тупую работу делают роботы, а люди, даже неквалифицированные, с помощью роботов делают (относительно и в кавычках) «сложную».
Запись воркшопа о том как сделать своего собственного ИИ агента с долгосрочной памятью (как за бесплатно получить функционал StackAI стоимостью $900/мес) опубликована в Boosty.

В рамках вебинара мы разобрали:
— что такое ИИ агенты?
— какие есть методы "дообучения" ИИ?
— для каких бизнес кейсов подходит долгосрочная память? как они работают?
— как сделать свой собственный прототип за $0 и за 15 минут?
— как хранятся данные в векторых БД и как с ними работать?
— как сделать из этого публичный интерфейс?
— как изменять функционал агента, добавляя папки с документами или скейпинг вебсайтов?

В следующих частях покажу как связать с ботом, но, самое интересное, это будет поговорить о том как строить семантический слой приложений. Записать данные в векторную базу и их оттуда достать - легко. А вот создать агента, который умеет использовать десятки инструментов для работы с таблицами, аудио, длинными и короткими текстами, named entity, стилям — вот тут уже попахивает сид раундом на $3М.
Несколько источников одновременно раскрыли инсайды о следующей, пока непубличной, модели от OpenAI. От техно-мистиков из e/acc твиттера до потаённых нор Реддита, инфа сходится в следующем:

— новая модель, наследник GPT-4, называется «Арракис»
— модель имеет модальность «все ко всему», то есть на вход получает видео/фото/текст/звук и выдает так же любую из них
— значительно лучше GPT-4 и сравнима с топовыми экспертами-людьми во многих областях (цитата: «внутри OpenAI мы достигли AGI», что бы это не значило)
— имеет функционал автономного агента, умеет создавать для себя инструменты и пользоваться ими
— выйдет в 2024

Авторы этих постов за последние годы до анонсов в СМИ уже предсказывали точный функционал и дату появления продуктов компании, поэтому, хоть и звучит мутновато, инфа относительно credible.
God tier пейпер про рассуждения и логику у LLM. Разобрал для вас все существующие способы сделать ИИ умнее. Если вы делаете AI продукт, приклейте эту картинку себе на монитор.

Авторы сделали компексный разбор всех существующих механизмов и способов добиться повторяемых и глубоких логических рассуждений от LLM (на картинке). Вот краткий обзор научной мысли в направлении обучения LLM рассуждениям.

Prompt engineering
— Одноэтапные, несколько примеров с цепочками мысли получаемые через CoT промт
— Многоэтапные, разбиение на подзадачи, последовательные промты

Оптимизация процессов
— Самооптимизация, калибровка с помощью дополнительных модулей или другой "проверяющей" LLM
— Ансамблевая оптимизация, когда LLM задает один и тот же вопрос многим клонам самой себя и потом выбирает самый популярный вариант
— Итеративная оптимизация, автоматический файн-тьюнинг LLM на сгенерированных примерах

Внешние механизмы
— Физические симуляторы, имитация процессов через мультимодальность
Интерпретаторы кода, написание кода самой LLM для достижения результата рассуждений
— Обучение инструментам, внедрение вызовов внешних инструментов через агентов

Дополнение знаниями
— Неявные знания, извлечение из LLM через промтинг
— Явные знания, поиск релевантных знаний во внешних корпусах типа RAG

В целом промты позволяют активировать в LLM способности к логическому мышлению и рассуждениям. Комбинация стратегий промтов и знаний (RAG) это главная идея для улучшения рассуждений.
#ИИ_для_жизни

Часто просят рассказывать о том как я использую ИИ в своей жизни и работе. Заметил, что последние недели >50% моей работы делается с помощью ИИ-инструментов. Помимо стандартного набора вкладок, которые открыты всегда (Claude, ChatGPT plus, MJ Discord, perplexity, локальный quivr), хочу поделиться всякими интересными продуктами и лайфхаками, которые будут полезны для вас.

Записал для вас видео о том как сделать аналитику по рынкам и продуктовые исследования на основе подкастов. И все это абсолютно бесплатно.

По моим грубым оценкам такой подход экономит ~90% времени на исследование новых рынков или сфер, давая при этом 80% результата и инсайтов. Промты, исходники, ссылки, детали этого и других проектов публикую в бусти.

https://youtu.be/qbeUt-ai22M
ИИ меняет структуру экономики. Для кого-то (подписчиков Gershuni в первую очередь!) это гигантская возможность добиться небывалых высот и внутренней гармонии; для других — риск остаться без работы или с 1/10 от своей зарплаты. Давайте разберём на конкретных примерах, цифрах и данных что нас ждёт.

80% всех профессий и работ в США изменяться благодаря LLM; в каждой из них как минимум 10% задач будут автоматизированы (выполняться с минимальным участием человек без потери качества) с помощью ИИ. А для 19% всех сотрудников в экономике автоматизация затронет более 50% ежедневных задач. [источник]

Великий Уравнитель в действии: чем выше уровень образования и оклад, тем больше автоматизации появится в профессии. Для бариста, сантехника или парикмахера уровень почти нулевой; для аналитика Wall Street или юрисконсульта — очень высокий. Для профессий с средней з/п в $30k/год задачи подверженные автоматизации составляют около 5% (по разным моделям); для з/п от $80k — это 50%.

Всего, учитывая текущий уровень развития технологий LLM, авторы ожидают автоматизацию ~15% всех задач в экономике (без потери качества) и до 47% учитывая не просто ChatGPT, а новые продукты созданные на основе LLM.

Авторы статьи приходят к выводу, что LLM это технология общего назначения (типа как электричество) и большинство кейсов применения еще просто не появились или находятся на очень ранней стадии. Со временем, технология будет улучшаться и эти цифры поменяются.

Запомните, дети: сегодня мы используем самую тупую, никчемную и примтивную версию generative AI за всю нашу жизнь.
#ИИ_для_жизни

Сегодня расскажу о продукте Rewind.

Rewind записывает все, что просиходит на вашем компьютере. Все приложения, сайты, звонки, видео и звук. А потом позволяет суммаризировать и искать по этой информации.

Например, я могу спросить "на прошлой неделе, не помню в какой день, я созванивался на тему организации закрытого ИИ-чата. какие форматы подписок мы обсуждали и в чем плюсы/минусы каждой?". Или: "я в понедельник читал в телеге про Padle теннис (не помню ни канал, ни время), найди мне этот пост". Или я могу подключиться на звонок, уйти делать зарядку, а Rewind мне расскажет все что из сказанного касается персонально меня. Rewind запоминает не только текст, но и голос, видео и даже текст с картинок (поисковик по мемам!).

Штука, которая изменила мою жизнь и экономит 5+ часов каждую неделю на поиск или анализ информации. У меня Rewind запущен 24/7 и пишет абсолютно все, но вы можете заблокировать ему доступ к каким-то приложениям.

В следующий раз когда залипнете на 15 минут поисков и вспоминаний с мыслью "где-то это было, не помню где" — знайте, что в мире уже есть десятки тысяч (а скоро — миллионов) людей, у которых такой боли больше нет.
2024/10/03 13:20:52
Back to Top
HTML Embed Code: