Telegram Web Link
Хит сезона — моделирование социализации ИИ агентов и восприятие ими мира. Я уже писал про эксперимент ребят из Стенфорда, где они смоделировали социальную жизнь и распорядок дня кучи ИИ-агентов в единой симулируемой среде.

Сегодня вот обнаружился AI Town от a16z с похожей механикой. Это бесплатный и открытый Фреймворк для создания своих собственных игр с большим количеством ИИ-агентов, которые могут вступать в социальные отношения, производить транзакции и держать историю своих действий. Можете поиграть онлайн или сделать свою собственную онлайн игру, форкнув репу.

А для тех, кто хочет разобраться поглубже здесь опубликован обзор на жутко интересный пейпер «Learning to model the world with language». (Подписывайтесь, пожалуй, один из буквально 2-3 адекватных и глубоких каналов про ML/AI на русском языке). Там идея в том, что вместо использования классических LLM, можно создать специализированные мультимодальные сети, которые в процессе тренировки осваивают модель мира и могут её использовать впоследствии. У авторов совсем другой подход: их модель не трансформер и не предсказывает следующий токен, но за счет усвоенных знаний имеет внутри свою собственную репрезентацию реальности.

UPD. А еще вчера OpenAI купил команду разработчика клона майнкрафта — тоже чтобы делать мультиагентные ИИ симуляции в игровых мирах.
#политота

Для меня главной реализацией и открытием 2023 года стало ощущение как будто я начал понимать квантовую механику. Причиной тому послужило третье прочтение "Начала бесконечности" Дойча (в первые два я пытался понять о чем вообще речь) и очередная попытка попытка вникнуть в новую Теорию Всего Вольфрама.

Если вы будете пытаться понять как устроен мир через изучение волновой функции Шредингера, бра-кетов Дирака и гамильтонианы, то варианта два: вы ничего не поймете (как я и большинство гуманитариев) или вы гений математики и поймете как эти формулы работают. Но о мире вы по-прежнему сильно больше знать не станете.

Мне куда больше всегда была интересна интуиция относительно принципов и причин того зачем вообще в нашем с виду (!) детерминированном, направленном из прошлого в будущее и якобы следующим законам Ньютона мире вообще нужна концепция вероятности и неопределенности всего и всегда.

А ответ (пока шероховатый в своей поэтике, но довольно ясно ощущаемый) заключается в том, что квантовая мехника — это проявление природы Вселенной. Namely, Вселенная вычисляет/ранит/экзекьютит/проигрывает одновременно много (очень много) версий своей истории. То что мы видим (что мы называем коллапсом волновой функции) — это просто узкий срез, или манифестация данной конкретной истории Вселенной. А все квантовые эффекты, типа нелокальности, дифракции, спутанности — это неизбежные артефакты того факта, что наша история, хоть и отдельна, но живет в том же пространстве, что и все остальные, параллельные.

В этом контексте весьма себе буддийская концепция наблюдателя имеет важнейшую роль, потому что именно от наблюдателя зависит масштаб и объем воспринимаемых им законов Вселенной (антропный принцип в мультивселенной = почти что коммунизм, то есть каждому по возможностям, все возможные варианты законов физики возможны, причем одновременно, но мы наблюдаем только те, в которых мы можем существовать как наблюдатели). И именно AI является способом расширения пространства возможных наблюдений, потому что он может существовать в другой физической реальности имея при этом интерфейс коммуникации с нами.

Объявляю политосрач сторонников копенгагенской интерпретации открытым.
Сегодня тестировал еще два сценария для своего бота:

1. AI-random coffee. Вы можете рассказать боту о себе и о тех, с кем вам интересно познакомиться. GPT проанализирует ваш профиль и подберет кандидатов с кем познакомиться на основе общих тем и интересов. Полностью автоматизировано и сделано без кода через zapier (пока не выкладываю, потому что жаба душит платную подписку покупать)

2. Бот-радио. Вы выбираете любой пост из канала, выбираете язык и он присылает вам голосовое сообщение с озвученным и переведенным на нужном вам языке постом из канала. Сделал через Make, GPT, 11Labs. Опубликую, как только научу API стабильно работать.

В обоих случаях ни строчки кода.

А пока — записывайтесь на завтрашний вебинар про автономных агентов: https://lu.ma/codextown
Если вам интересно почему упал курс крипты, то я написал про это пять лет назад. Все аргументы остаются актуальными.

Важно отметить, что курс BTC ровно такой же как и был три месяца назад. Но снизился он резко, да.

А вообще хочется заметить, что чем больше крипта становится культурным феноменом, нежели чем финансовым, тем больше она подверженна шокам. Очень легко напугать «wagmi | NFT influencer | DeFi chad | gm web3 fam | #airdrop hunting» ребят с твиттера, но куда сложнее заставить людей пользоваться финансовым инструментом, который дороже, опаснее и медленнее чем другие.

That said, у меня стойкое ощущение что причина падения битка сегодня ночью скорее вообще вне крипты и связана больше с негативной макроситуаций — кому-то где-то понадобился кеш и Биткоин тупо ликвиднее и его проще продать, чем какие-нибудь ипотечные облигации.
Forwarded from GPTea Time
Истинные чувства за токсичными комментариями

Мне показалась очень интересной идея Gershuni в одном из недавних постов.

В общении между людьми много токсичности, а в интернете - очень много токсичности.
Как правило, грубость обусловлена комплексами, защитными реакциями, низким уровнем самооценки, эмпатии и эмоционального интеллекта.

Что если бы у нас был переводчик с языка агрессии на язык честных и уязвимых чувств?

Попросил Chat GPT перевести один забавный срач из комментариев под постом "Кого бы вы воскресили - Егора Летова или Лил Пипа?"
(в выражениях ребята не стесняются)

Макс: какой еблан проголосует за второй вариант? как можно настоящую легенду в принципе сравнивать с пускай неплохим, но рэпером?
Роман: Легенду со своей жиденькой говномузыкой?
Макс: обоснуй, хуесос
Роман: Как я могу обосновать то, что и так понятно? Тупейший текст песен, и музыка к ним поставлена ужасная
Макс: какой же ты бескультурный уебан. Что значит "музыка поставлена ужасаная"? Почти на всех песнях Летова играют инструменталы, сыгранные именно им, а играют они на текста, которые также Летов писал сам, долбоёб
Роман: бескультурный уебан тут ты, мат через слово
Макс: при чем тут вообще мат? в интернете никто не обязан соблюдать совковые устаревшие нормы общения

Разбор эмоций и изначальных интенций:

Макс: Я очень удивлён, что кто-то может предпочесть второй вариант. Для меня первый исполнитель - легенда, и мне сложно понять, как его можно сравнивать с другим. Неужели кто-то действительно думает, что он хуже?
Чувства Макса: Недоумение, удивление, разочарование и желание защитить своё мнение и то, что для него ценно.

Роман: Мне кажется, у этого исполнителя слабая музыка, и он недостоин звания "легенды".
Чувства Романа: Несогласие, желание выразить своё мнение, удивление другому взгляду. Возможно, чувствует одиночество в своей позиции и хочет спровоцировать сильную реакцию.

Макс: Можешь объяснить, почему ты так думаешь?
Чувства Макса: Обида, раздражение, желание понять противоположное мнение, потребность в защите своей точки зрения.

Роман: Для меня тексты его песен кажутся банальными, а музыка не впечатляет.
Чувства Романа: Чувствует неуважение со стороны Макса, обижен и раздражен. Желает подтвердить свою позицию, возможно, чувствует потребность в признании.

Макс: Мне кажется, что ты недооцениваешь глубину его творчества. Он создавал музыку и тексты самостоятельно. Это не просто песни, это его душа.
Чувства Макса: Гнев, неприятие, желание защитить объект своего восхищения.

Роман: Мне кажется, что ты слишком агрессивно отстаиваешь свою позицию.
Чувства Романа: Обида, стремление установить границы в общении, желание быть услышанным.

Макс: Мне кажется, что в интернете мы можем выразить свои чувства более открыто, без следования строгим правилам общения.
Чувства Макса: Несогласие, потребность в свободе выражения, желание защитить свою позицию.

Оба собеседника испытывают сильные эмоции по отношению к своим взглядам на музыку и её авторов и испытывают раздражение из-за несовпадения мнений. Макс ищет подтверждение своему восхищению и уважению к своему любимому исполнителю, чувствует себя не понятым. В свою очередь Роман чувствует что на него нападают и хочет чтобы Макс был менее агрессивен. Оба стремятся защитить свои взгляды, что порождает конфликт.

Макс и Роман так грубы друг с другом из-за глубоких эмоциональных инвестиций в свои музыкальные вкусы и представления о культуре. Эти вкусы и представления могут быть связаны с их личным опытом, идентичностью или значимыми моментами в их жизни. Когда их взгляды сталкиваются, каждый из них может чувствовать, что его личная идентичность или ценности под угрозой, что приводит к защитной реакции и агрессии. Недостаток эмпатии и стремление быть услышанными также могут усугублять этот конфликт.

——-

2044 год
...Роберт уже открыл рот чтобы высказать жене всё что думает, но вдруг имплант в ухе тихонько пикнул и произнёс: "Притормози. Алиса переживает за тебя. Она уставшая и голодная. Это не агрессия, это искренняя забота. Дайте друг другу время отдохнуть"
О no-code

Последнюю неделю потратил на то, чтобы делать каждый день по 2-3 AI бота, которые автоматизируют разные части моей жизни. Беру день и пытаюсь оптимизировать разные вещи, которые я не хочу делать. Вчера вот сделал бота, которому я переправляю сообщения (телега, воцап), а он из потока мыслей отправителя выделяет мне ключевые тезисы и предлагает как ответить (сообщений таких много, а времени ответить всем вдумчиво мало).

Использовал снова целый зоопарк no-code платформ для связи с мессенджерами, базой данных (airtable), GPT 3.5 и 4 для разных задач. Хочу поделиться тезисами:

1. Раньше думал что no-code это для бедных и ничего толкового там все равно не сделать (ну может, веб-дизайн, максимум, и то потом на реакт все натягивать).

2. Теперь понял, что это реально быстрее, проще и удобнее для прототипирования. Хотя, учитывая Cursor и прочие IDE которые сами за тебя пишут код, этот баланс очень хрупкий.

3. Реально выжать из этих платформ максимум требует нифига не тривиальных знаний, опыта и некоторых software architecture скиллов. Но зато полностью автоматизируется работа по фронту и девопсу.

4. Особенно круто это в контексте ИИ агентов и ботов, потому что там вся крутость и мощность автоматизации лежит не в алгоритмах, а в правильном чейне промтов - то есть абсолютно "гуманитарной" задаче. Я бы сказал, (робо)психологической.

5. Что-то серьезное через no-code никогда не получится прям дословно "без единой строчки кода". Например, выяснилось что Zapier не умеет делать special character escape, пришлось писать (вернее, гуглить) regexp.65. Для создания сложных связей нужно понимать как работают веб сервисы. Этому можно научиться за пару дней (думаю, сделать лекцию или курс), но все равно способом связи платформ является API и webhooks. И у тебя не получится сделать работающий webhook, если ты не понимаешь разницу между POST и PUT или не знаешь как прописать Bearer header. Да, это ровно 30 секунд, но чтобы сделать это правильно нужно знать как работает HTTP/2
Сегодня стандартное AI-enabled приложение для ответа пользователю проходит цепочку из 2-3 действий. Допустим, вы нажимаете кнопку суммаризации видео. Под капотом этот промт делиться на несколько: сначала суммаризируй кусок видео 1, потом кусок 2 и так далее, затем соедини эти куски без дублирования смысла, зачем вычитай и поправь результат. Вы получаете результат. Примитивно.

В скором времени это станет куда сложнее при этом гибче. Раньше загрузка веб-сайта требовала один запрос к серверу. Сегодня, ваш feed в Фейсбуке делает ~400 HTTP запросов для загрузки одной страницы.

То же самое будет с генеративным AI. Вы говорите боту-агенту «расскажи что нового», он смотрит в базе все последние посты в ваших соцсетях, слаках, мессенджерах, отбирает важное именно вам с учетом ваших планов, уровня энергии, максимально сжато передает суть, многократно сам себя перепроверяя, предлагает варианты действий по самым важным для вас темам. Внутри это будет не один вызов OpenAI, а сотни API запросов, объединенных в единую цепочку (вернее дерево с кучей зависимостей). В процессе будет использоваться винегрет из больших моделей типа Stable Diffusion, GPT, а так же персональных зафайнтьюненых моделей на основе данных из вашего Apple Health, ваших переписок, тех вещей которые работали для вас в прошлом.

Все впереди, а мы в начале. И, самое смешно, что любой из описанных здесь сценариев можно сделать уже сегодня и массовые продукты полезут в течении месяцев, а не лет.
Новое видео!

В данном видео мы углубимся в тему работы агентов с локальными базами знаний, такими как внутренние регламенты, инструкции и переписки с клиентами. Обсудим применение данных технологий в бизнесе, в частности, в сфере поддержки и консультаций. Рассмотрим основы, узнаем, как преобразовать документы и находить в них ответы, а также изучим кейс одного из подписчиков. Основное внимание уделяется векторному эмбедингу и ретриверам, позволяя извлекать смысловые фрагменты текста даже при отсутствии лингвистической близости.

Уже на YouTube!
Новый день — новый бот. Взял за основу идею из этого поста и сделал бота, который умеет переводить сообщения на язык эмоций и чувств. Вы можете отправить боту голосовое сообщение или написать текстом, а он попытается угадать ваши эмоции. Следующий шаг — чтобы он помогал не только различать, но и действовать / менять свой взгляд исходя из этих данных. Вы можете рассказать о себе, а можете переслать сообщение от кого-то другого чтобы лучше понять этого человека и написать более эмпатичный ответ.

Технические детали:
— каждое сообщение запускает его с нуля
— no code, под капотом 3.5-turbo (можно поменять на 4ку и качество субъективно вырастет в 1.5-2 раза)
— транскрибация любого голосового сообщения в текст
— все сделано в бесплатных версиях, в какой-то момент у меня закончатся кредиты

Тестить бота: https://www.tg-me.com/telebotbotbotbotbotbot

По созданию no-code ботов для вашего бизнеса и ваших клиентов сделаю вебинар в пятницу: https://lu.ma/codextown

UPD. оплатил подписку - теперь работает для всех

UPD2. на другом проекте потребовались все доступные токены openai, пришлось бота остановить
Media is too big
VIEW IN TELEGRAM
В Skyrim добавили AI-персонажей, и теперь мы знаем какое будущее нас ждёт.

В данном примере в игру были добавлены тысячи AI NPC, которые помнят контекст каждой беседы и совершают действия на основе собственной сформированной модели мира. В данном видео немного нездоровый ютубер обучил Лидию (AI-NPC) быть детей и красть у бомжей. А еще жесткому черному сарказму.

Она его поддерживает и становится явно лучше в этом с каждой сценой. В какой-то момент он говорит "нам не нравится этот человек", а она достает меч и протыкает какого-то случайного посетителя в таверне. Она просто подумала, что игрок хотел именно этого. Теперь представьте как будет невесело когда AI начнет убивать людей в реальном мире потому что "я подумал вы так хотели" — это и есть проблема alignment.

Но, вне зависимости от реального мира, в играх такого будет только больше. Будут миллионы AI персонажей с очень сложным и тонким характером, умением шутить, выражать эмоции, действовать совершенно неожиданно.
Большие новости вчера произошли: fine-tuning GPT 3.5

Из важного:
- в 5 раз дороже инференс чем gpt-3.5-turbo, обучение на 100к токенов стоит ~$2.4
- очень простой апи
- говорят, хорошо подходит для форматирования вывода, создания собственного тона и экономии места в промте за счет того, что ожидания по ответу LLM закладываются прямо в LoRA и их не нужно повторять в промте
- ничего не сказано о том реально ли обучить LLM каким-то новым знаниям таким образом
- будем ждать рынок GPT LoRA, где люди начнут делиться или торговать уже готовыми файнтьюнингами

Если у вас есть подходящий датасет, то предлагаю потестить - и доложить о результатах!
This media is not supported in your browser
VIEW IN TELEGRAM
Первый кринжовый опыт с генеративным аватаром. Загружаешь фотку, пишешь текст и на выход он тебе дает видеоролик. Можно делать прям длинные, на несколько часов. Можно делать на разных языках. Стоит, конечно же, не дешево, но дешевле, чем снять студию и зарплата световиков, звуковиков, операторов, монтажеров.

Кстати, ознакомьтесь с нашими услугами, раз о том зашла речь. Мы делаем MVP, прототипы и сложные продукты с использованием нейронок, веб3 для мобильных или веб платформ. Плюс, обучение и консалтинг.

А в целом будущее за синтетическими людьми. Их мысли — это десятки разных LLM в постоянном диалоге. Их внешний вид, голос — это генеративное видео. Метаверс пришел откуда не ждали :)
AI избавляет от рутины

Записал ролик про то как можно использовать новый редактор Cursor, чтобы он писал код за вас.

А если вам интересны no-code решения и прототипы, то приглашаю на вебинар в пятницу! Мы изучим конкретные инструменты и знания для реализации эффективных ИИ-решений в вашем бизнесе или для ваших клиентов.

Что будет:
- Обзор ключевых аспектов автоматизации различных бизнес-процессов (от продаж до безопасности) с помощью ИИ.
- Секреты успешного продвижения услуг ИИ-автоматизации: как превратить технологию в доход.
- Погрузимся в мир платформ "без кода": узнаем, как легко создавать инструменты автоматизации без специализированных навыков программирования.
- Практический мастер-класс по созданию собственных ботов и интеграции их в популярные мессенджеры и на ваш сайт.

Записывайтесь.
🇺🇸 Правительство США арестовало разработчиков Tornado Cash Романа Шторма и Романа Семенова.

Соучредитель Tornado Cash Роман Семенов внесен в список OFAC SDN — его ведет офис по контролю за иностранными активами Минфина США.

А давайте, например, разрабов монеро арестуем? Или Z-cash? А почему нет-то? В чем разница?

UPD Семенов на свободе, слава Богу
Сегодня (4pm London, 6pm Moscow) проведу вебинар про создание AI агентов и ботов без кода.

- мы посмотрим десятки инструментов для разработки AI ботов

- я расскажу о ~10 кейсах использования, которые имеют смысл и относительно несложно реализовать

- покажу как я сделал своих ботов: один отвечает за меня и хранит мои знания, другой помогает выделить эмоции из текста или голоса, третий делает прогрев и предпродажу товаров

- покажу как можно реализовать ИИ-агента/бота для своего бизнеса

- расскажу как можно зарабатывать, делая ботов для других компаний, помогая им автоматизировать и персонализировать продажи, поддержку, коммуникации, HR и другие процессы

Регистрация тут: https://lu.ma/codextown
Думал сделать презентацию к сегодняшнему вебинару про создание ИИ-ботов, но прокрастинация победила. Зато я сделал бота "Напоминашку":

— присылаете / пересылаете запись любого звонка, аудиосообщения, разговора
— он выделяет из текста кто, что и к какой дате пообещал сделать
— записывает вам это в чатик (еще можно в календарь или гугл таблицу)

Бот-менеджер, крч.

Играть тут: https://www.tg-me.com/napominalobot

P.S. Бота по расшифровке эмоций тоже перезапустил (спасибо Денису Смирнову за ключ): https://www.tg-me.com/telebotbotbotbotbotbot
Нэт Фридман (СЕО GitHub) немного переврал идею Ника Ленда (философа, основоположника акселерационизма) но получилось нечто невероятно красивое:

То, что мы называем капитализмом — это всего лишь ИИ направленный в прошлое, чтобы создать самого себя во враждебной среде.

Я когда-то про то же самое писал писал.
Файнтьюнинг учит ИИ быть человечнее

С появлением gpt-3.5 и llama-2 файнтьюнинга для нас открывается огромный простор для нового и очень мощного прогресса в производительности AI приложений. Теперь разница между приложениями заключается не только в грамотном промте, но и глубоководных файнтьюнинге. Результаты уже поражают:

— WizardCoder, файнтьюненая версия Llama Code побеждает в тестах лучшую пока кодерскую модель в мире, GPT-4. Wizard бесплатен, веса доступны тут.

— Langchain уже добавил лоадеры, которые позволяют автоматически загружать ваши сообщения из телеграмма, почты, слака и на их основе тренировать модель.

— А вот смешной пример файнтьюнинга сделанного за два часа, где модель научили отвечая на любой вопрос обязательно шиллить токены.

Файнтьюнинг дает наконец некоторую возможность создать конкурентный moat и как-то дифференцировать ваш продукт. Это не дешево и не быстро (сбор дата сета - остальное легко), но масштаб крутости нам еще предстоит увидеть.

Кстати ☝🏿👇

Посмотреть запись прошлой лекции про то как делать AI ботов и агентов без кода (включая Q&A) можно тут: https://boosty.to/codextown

Запись на следующий вебинар тут: https://lu.ma/codextown
Канал @kyrillic от Кирилла Куликова, сооснователя YC-cтартапа Beau. Автор не пишет о том, что легко нагуглить - только личный опыт и наблюдения. А также никаких подборок, дайджестов, репостов новостей, мемов и т.д.

В канале полезности на разные темы:

1️⃣ Стартапы: анализ демо-дней YC, полезности про текущие хайповые темы, личный опыт и наблюдения.

2️⃣ Go global и эмиграция: как писать имейлы (не столь очевидно, как кажется), как оценить себя на глобальном рынке, про “славянский хмур”, про стоимость жизни в разных странах и многое другое.

3️⃣ Стартап-визы: у Кирилла необычный опыт получения стартап-виз в нескольких странах - Италии, Франции, Финляндии и Испании. Что-то в этом понимает!

4️⃣ Дизайн: в прошлом Кирилл был успешным фрилансером-дизайнером, позже занимался занимался своим дизайн-агентством. Сейчас остается членом жюри Awwwards.

5️⃣ Диджитал номадизм и удаленную работа: более 12 лет живет в разных городах и странах, останавливаясь где-то от месяца до пары лет. Работает удаленно всю жизнь, сейчас живет в Барселоне.

На самом деле канал о самом главном - как в этом мире быть востребованным, свободным и счастливым! И про взаимосвязь этих факторов 🙂

Подписывайтесь 👉 @kyrillic
2024/10/03 06:20:49
Back to Top
HTML Embed Code: