Telegram Web Link
Assisterr AI на этой неделе привлекла $1.7M в Pre-Seed раунде и расширяет команду.

Assisterr строит сеть Small Language Models (SML), данные для которых собираются методом краудсорсинга из сообщества.

Знаю, что меня читают многие из FAANG, поэтому хочу обратить ваше внимание на вакансию AI R&D Lead в стартапе. Это отличная возможность для проведения исследований, их коммерциализации и тестирования с участием более 170k человек.

Подробнее👇

https://apply.workable.com/assisterr/j/EE7907A2BA/

X: https://x.com/assisterr/
AGI — это про способности уровня человека, а не конкретные навыки

Пару столетий назад больше 50% населения Земли были заняты производством еды. Сегодня это от силы 1-2%. Благодаря технологиям, у людей освободилось время и они нашли другую, новую, потенциально более ценную деятельность.

Если ИИ завтра заменяет всех программистов, водителей и врачей, то это еще не AGI.

Настоящий AGI — это уровень, когда ИИ-системы могут справляться с задачами, которые люди выполняют сегодня, но так же и которые люди теоретически начнут выполнять когда у них освободится время от текущих работ. То есть, это про способности, в том числе к обучению и адаптации.
Как почувствовать себя изгоем?

В крипте: если у тебя нету ламбы, ролса и особняка на острове (или острова)

В ИИ: если у тебя нету PhD
О гегемонии LLM

С релизами последней версии Ламы, в первые дни мы видим множество файнтьюнов, которые идут вровень с топовыми моделями GPT и Gemini. Например, вчера Athene-70B, тьюн Ламы, занял 8 место в общем лидерборде lmsys.org

С каждым месяцем разница между открытыми и закрытыми моделями становится все меньше. За счет открытости весов и большего количества open-source разработчиков, открытые модели смогут и обогнать лидеров.

Децентрализованный ИИ — это не про продажу сгененированных вайфу через чатбот за токены:
- это про свободный доступ к комьюту в тысячи H100
- это про краундсорсинговый сбор данных миллионами людей
- это про публичную оценку и улучшение моделей через тысячи бенчмарков
- это про открытось и простоту создания агентов, подобно сайту в интернете
- это про десятки специализированных агентов и моделей и раутинг между ними
- и, главное, это про отсутствие необходимости единой точки доверия и контроля.
Как сделать так, чтобы инвестор дал денег?

Всё просто. Сначала нужно узнать, что действительно нужно инвесторам и выявить их потребности. А потом дать им это.

Большинство действует наоборот. Сначала пытаются презентовать свой проект без понимания, что важно для инвесторов при принятии решений о финансировании проектов.

Если вам интересно узнать, почему инвесторы одним дают деньги, а другим не дают, то рекомендую подписаться на телеграм-канал предпринимателя, ex-продюсера программы «Стартап Академии Сколково» Дарьи Приц.

В своём канале Даша рассказывает про потребности инвесторов и показывает примеры презентаций, после которых инвесторы охотно вкладываются в проекты.
GPT: враг или друг?

От авторегрессивных трансформеров до AGI еще далеко, а вот тексты современные чатботы пишут складные. Вот, например, исследование с последнего ICML относительно использования LLM ревьюерами научных статей. Несколько выводов:

- 8-12% комментариев и ревью написано с помощью LLM (не просто для исправления грамматики, а прям целиком)
- в областях, далеких от NLP/ML, рост использования LLM есть но в разы меньше (то есть, адопшен еще не наступил)
- чем ближе дедлайн, тем больше используют LLM
- определить использование LLM сложно, все "GPT-детекторы" не работают, но авторы придумали свой метод, который не универсален, но работает сильно лучше для данного кейса

Мое мнение: писать тексты с помощью GPT/Claude — это моветон, это все сразу замечают и это во многом бесполезно. Но редктировать, брейнстормить, наговорить на ходу текст и попросить GPT сделать заметки — это как будто неизбежная часть любой писательской / рисерчерской деятельности.
В эту пятницу в 18:00 CET проведем прямой открытый эфир в телеграме с Максимом Кашулинским, журналистом, основателем Reminder Media.

Темой разговора будут изменения: как краткосрочные и технологические, так и долгосрочные, социальные. Так же сделаю небольшую презентацию статьи, над которой я сейчас работаю, посвященной "интернету интеллекта" — грубо говоря, сетевой модели взаимодействия с ИИ. На уровне интерфейса это гугл, который не отвечает, а выполняет задачу за вас. На уровне бекэнда это сеть сетей из агентов, нейронок и других моделей, которые по-умному связаны и маршрутирированы.

Встречаемся в канале e/acc в эту пятницу!
Forwarded from Igor Stepahin
TheGrandTimeline_2000h.png
2.9 MB
Привет! С разрешения @sgershuni хочу поделиться своим проектом. Я продуктовый дизайнер, в прошлом head of product design Gelato Network. Это историческое исследование и визуализация данных, моя попытка рассказать всю историю крипто в интересном формате.

Начал эту штуку 3 года назад по приколу, время от времени рисовал в стол, иногда забрасывал на месяца (таймлапс как “пруф-оф-ворк” https://youtu.be/lkVy6JzlyNY) и в итоге оно превратилось во что-то реально большое. Сейчас пока сижу без работы решил почистить проект и обернуть чтобы опубликовать текущий прогресс.

У меня там несколько слоёв информации: Люди, События на таймлайне, Периоды как гантт, динамика рынка BTC и ETH, а так же визуализация всех крупных Взломов, Краж и Скамов в видео гибрида bubble chart/swarm plot. Что-то уже в хорошо проработанном виде как периоды, цены и взлом, а где-то еще тонна ресерча впереди — в слое событий.

Сейчас это всё живет в Figma как открытый для всех файл где я продолжаю работу. Финальный формат, если минимум, то это так же статичный цифровой плакат + печатный физический “маленький” около 2 метров шириной и полноразмерный холст чтобы весь текст читался это около 8 метров, но это пока мечты и планы.

Делаю это абсолютно один и сейчас цель найти поддержку, спонсоров чтобы сфокусироваться на проекте еще на полгода-год и дотащить до релиза v.1.0. А в идеале еще и на разработку интерактивной версии а не просто статичной. Уже получил маленький грант от Lido что покрыло месяц работы, хороший знак.

Фигма https://www.figma.com/design/pENhenndHyIMwzW2LgKzNd/The-Grand-Timeline

Анонс в твиттере https://x.com/stepahin/status/1817961202913526038
Live stream scheduled for
Live stream started
Live stream finished (1 hour)
Об ИИ-институтах

В прошлую пятницу на стриме много говорили про интернет интеллекта и про интернет агентов. Представим, что мы уже в мире с сотнями миллионов автономных ИИ агентов, которые умеют выполнять полезную для людей работу, зарабатывать и тратить деньги, общаться и выстраивать процессы между друг другом. Здесь сам собой возникает вопрос о праве, этике и институтах: а как и благодаря чему будет обеспечиваться надёжность, предсказуемость и этичность того, чем эти агенты занимаются?

Важно: я тут еще не говорю про роботов, а ведь Илон Маск вчера в подкасте пообещал, что у нас уже очень скоро (мол, все готово, ждем поледних разрешений) будут миллиарды домашних универсальных прямоходящих роботов. И я тоже думаю, что их будет больше, чем сегодня автомобилей, ибо они более универсально полезны. Так вот, для ИИшек, которые ходят по улице и могут кинуть в тебя кирпич этот вопрос будет стоять еще важнее, но сегодня поговорим о строго цифровых агентах.

Начнем с модного папируса, в котором авторы показывают как ИИ-агенты могут научиться соблюдать нормы и регуляцию, а так же создавать свои собственные социальные институты. Без этого агенты не смогут эффективно и повсеметно встраиваться в кибернетическую экономику. Для этого авторы задизайнили Нормативный Модуль, который (а) учиться тому что можно можно, а что нельзя делать согласно нормам института, в котором они оперируют, и (б) выбирает действия, которые ненаказуемы или наказуемы, но цена наказания терпима.

Тут, кстати, Гугл показал в другой работе как децентрализованные ИИ-агенты могут учиться социальным нормам через публичные санкции/наказание: 20 агентов выращивают цифровые "яблоки" и взаимодействуют, записывая все социальные сигналы. У каждого есть доступ к "доске позора", куда он может публично написать чьи действия он не одобряет. В результате координация улучшилась, потому что агенты начали делать меньше действий, которые социально не одобрялись группой. Эта статья показывает, что общество агентов может само внутри себя обнаружить и устранить халявщиков и бездельников. Эх, вот бы людям так :)

Возвращаемся к нашему эксперменту. Разница с человеческим обществом в том, что у нас задачу наказания часто выполняет некоторый авторитет — закон, суд, государство, Бог. Авторы делают похожий сетап: много агентов, которые могут собирать разные фрукты (яблоки, бананы, апельсины и т.д.), несколько нормативных институтов которые создают правила. Сначала у агентов есть цель выращивать тот же тип растений, что остальные (то есть, кооперироваться), а так же "лидер", который решает за сообщество какой фрукт они выращивают в данной эпохе.

Два эксперимента: в первом случае агенты целенаправленно заточены не выоплнять указания лидера и активно его критиковать. В результате, действительно, почти никто не собирает тот фрукт, который указал лидер. Во втором же случае создается несколько институтов, которые являются авторитетными (то есть, агенты считают, что его санкции реально могут быть применены против них). Во втором случае авторы увидели куда более сильную кооперацию и согласованность поведения. В самой статье можете найти промты и точные результаты.
e/acc
В эту пятницу в 18:00 CET проведем прямой открытый эфир в телеграме с Максимом Кашулинским, журналистом, основателем Reminder Media. Темой разговора будут изменения: как краткосрочные и технологические, так и долгосрочные, социальные. Так же сделаю небольшую…
Запись опубликована здесь: https://www.youtube.com/watch?v=ZGv9-Da_wAI

- Будущее интернета и искусственного интеллекта
- Что такое агентная система и интернет интеллекта
- Как автоматизация процессов может сэкономить время и создать экономическую ценность
- Может ли создание такой системы может привести к потере работы для некоторых людей и появлению новых рабочих мест
- Как бизнес-модели могут развиваться и как они могут быть адаптированы к новым технологиям
- Как долго новые технологии будут выходить на рынок
- Цифровые двойники и их роль в будущем
- Создание компаний с искусственным интеллектом
- Существуют ли ограничения для создания искусственного интеллекта, который может обгонять человека в интеллектуальных способностях
- Как с помощью искусственного интеллекта может осуществляться манипулирование людьми
- Возможность оцифровки сознания и контроля над жизнью на Земле.
Еще одним инструментом координации для людей является система права. Несмотря на то, что классическое право не распространяется на автономных агентов как субъектов, несколько экспериментов показали что её можно воссоздать в цифровой и самоисполняемой форме.

Один из них расширил Voyager — популярного агента, который может автономно оперировать в игре Minecraft — до мультиагентной системы. В ней:
1. ИИ-агенты торгуются между собой, находя субъективно справедливые условия
2. Заключают формальный контракт в виде текста
3. Исполняют контракт для достижения собственной цели

Другая работа демонстрирует использование commitment devices ИИ-агентами для достижения кооперативного поведения в популярных теоретико-игровых задачках, типа дилеммы заключенного или максимизации сбора урожая (писал про это в прошлом посте).

А команда из MIT придумала формальный подход multi-agent RL, в котором эгоистичные агенты учатся решать социальные дилеммы через заключение контрактов. Тут доступен код их примеров для координации вокруг задач загрязнения (виртуальной) среды, трафика дорожного движения и управления общими ресурсами.

Наша портфельная компания выдала грант одним разработчикам подобной системы. Идея там состоит в создании агентов-участников рынка, которые умеют следовать правилам, заключать между собой контракты, а так же адаптироваться под рыночные условия и извлекать максимальную для себя пользу. Подход использует Agent Communication Language (ACL), созданный аж в 2001 году ровно для этих целей. Главное отличие в том, что за эти 20+ лет у нас появились агенты, способные к самостоятельному принятию решений, reasoning'у и интроспекции/рефлексии.
Интернет агентов

Постепенно действительно мультиагентные системы становятся реальностью. Не просто CrewAI/AugoGen, где одна и та же LLM запущена с разными промтами 10 раз, а действительно разные агенты с разным железом, моделями, инструментами и целями под капотом. Например, Alibaba сделали платформу на которой они в качестве эксперимента смогли запустить 20,000 таких агентов.

И в таком вот мире с миллиардами агентов (society of agents) ставится острым вопрос их координации, оркестрации, раутинга, поиска, коммуникации, платежей и даже кредита. Или, например, появится рынок контрактов (на блокчейне), которые ИИ-агенты используют между собой как шаблоны. А деривативы этих контрактов могут быть использованы как залог или актив в AI-native economic activity (сорямба, русский тут максимально чужд и неуместен).

Такой рынок будет использовать аналог AMM как инструмент покупки услуг и заключения контрактов. Агент предлагает работу, которую он может сделать согласно свой собственной кривой предложения, а сам факт покупки токена заключает цифровой контракт на её выполнение. Контракт может включать в себя санкции за невыполнение, процесс арбитража и страховку. Благодаря trustless природе блокчейна, вы можете собирать составной и сложный граф из контрактов с подрядчиками, чтобы выполнить более сложную задачу пользователя, с которой не в состоянии справиться одна модель/приложение/агент.

А работа по поиску оптимальной конфигурации, которая даст наиболее качественный, но дешевый результат пользователю — это некоторая новая форма AI-MEV сёрчинга. Ожидаю ярды баксов прямо вот в этом месте.
Почему агенты?

Во-первых, это эффективнее. Сеть агентов показывает результаты лучше, чем самая лучшая LLM. Архитектура Mixture of Agents показала 65,1% на Альпаке, тогда как сегодняшний лидер GPT-4o показывает только 57%. Эта статья (красивая, с картинками) показывает детальные бенчмарки сравнения использования SoTA LLMs с сетью агентов. Вторые выигрывают, причем часто даже оказываясь более выгодными при инференсе.

Как работает MoA?
1. Несколько "слоев" агентов, где каждый уровень состоит из нескольких LLM-агентов, которые улучшают ответы предыдущего уровня.
2. Агенты в MoA разделены на две роли: "предлагающие" (генерируют начальные ответы) и "агрегирующие" (синтезируют окончательный ответ).

Более того, увеличение количества уровней в целом увеличивает качество ответа. Однако, это делает систему медленее.

А в дополнение к этой идее, я наткнулся на концепт Роя Агентов. Фактически это формальный подход к представлению сети агентов как графа. Каждая нода графа — это вызов LLM, инструмент (поиск, код, API), а грани — это передача информации. В таком вот графовом виде можно представлять сложные мультиагентные системы с десятками, сотнями или даже тысячами шагов. В качестве иллюстрации к предыдущему посту я как раз приложил один из таких графов.

Идея и направление для будущего исследования (или создания миллиардного стартапа), если кому интересно: применить предсказания GNN (графовых нейронок) для автоматического создания оптимального графа агентов.
2024/10/03 23:22:46
Back to Top
HTML Embed Code: