Telegram Web Link
Ну что ж, рабочая неделя подходит к концу, а значит можно наконец от души погрузиться в папирусы и эксперименты. Сегодня два вкуснейших рисерча, которые (конечно же cherrypicked) толкают вперед повесточку автора этого канала:

1. Про то как агенты, работая вместе получили 2х более крутые результаты решая программерские задачи.
2. Про то, как агенты могут заниматься сексом создавать себе подобных, и про то, что, скорее всего, большинство ИИ-агентов в мире будут именно такими.

Остановлюсь на втором. Авторы верно утверждают, что в ML любая ручная оптимизация рано или поздно заменяется автоматизированной, выученной. Они предлагают новую дизайн парадигму, в которой фактически LLM поизводит поиск новых агентов в бесконечном и латентном пространстве всех возможных программ постепенно находя решения, которые все лучше и лучше решают определенную задачу.

Это близко к подходу, который получил наивысший резузльтат в "ультимативном тесте на AGI" - ARC challenge, где LLM производят дискретный поиск программ для решения каждой из логических задач. Более того, авторы применяют свой подход, в том числе, и к этому челенджу. В итоге они получили более крутые показатели точности по сравнению со всеми популярными сегодня агентскими методами типа chain-of-though, self-critique, debate, etc.

(Немного гипертрофированный) вывод: агенты, а не просто модели, дадут те самые триллионы эффективности в экономике, а агентов будут миллионы и миллиарды, они будут создавать сами себя и жить в интернете.

Ускоряемся.

#KeepCalm #AgentsAreComing
1x (компания, в которую мощно вложились OpenAI) представила новую версию робота NEO.

Рост: 165 см
Вес: 30 кг
Скорость ходьбы: от 5 до 12 км/ч
Может поднимать грузы до 20 кг
Работает до 4 часов на одном заряде
.

Скоро в каждом доме. Как минимум, таких будет больше чем машин, ибо машина это куда-то ехать, а тут все удовольствия сразу в постель.

Ускоряемся.
e/acc
1x (компания, в которую мощно вложились OpenAI) представила новую версию робота NEO. Рост: 165 см Вес: 30 кг Скорость ходьбы: от 5 до 12 км/ч Может поднимать грузы до 20 кг Работает до 4 часов на одном заряде. Скоро в каждом доме. Как минимум, таких будет…
Media is too big
VIEW IN TELEGRAM
Интервью с командой и некоторые детали процесса разработки. Вот, что запомнилось:

- норвежская компания (но софт в Долине, естественно), делают роботов с 2014 года
- это уже третья модель, первые две уже на рынке
- GTM это домашние помощники, потом пойдут в B2B вертикали, типа складов и стройки
- продавать начнут в следующем году
- к 2030 году ожидают, что цена будет «как машина эконом-класса»
- много интересных инноваций, но без деталей. как известно, в роботике руки это самое сложное. в отличии от стандартного подхода с actuators, они используют напряжение струны чтобы моделировать работу мышц человека. и ведь работает, хоть все им и говорили что это тупиковый путь.
- аналогия с LLM: в 2018 все думали, что будут тысячи специализированных LLM, а в итоге оказалось, что универсальные модели работают сильно лучше. то же самое ожидают и в роботах.
- через десять лет ожидают ~ миллиард дроидов в мире (я так понимаю, включая продукты конкурентов, которых сейчас как грибов)
О предсказаниях

Комментарии под последним постом оказались прямо в тему — ту, о которой я хотел рассказать. А именно, о рынках предсказаний в принятии решений в политике и бизнесе.

Простой пример: я рассказал о роботе, тут же в фейсбуке и телеграме появились мнения, что это нифига не робот, а человек в костюме. Я предложил спор на $10,000, в результате которого, если окажется, что робот реально способен на все эти движения, то я выигрываю обе ставки. Пока никто не согласился. (речь не о том как обучают робота, а кто под одеждой: человек или машина)

Это игрушечный пример для борьбы со срачами в комментариях и щитпстингом, но как я писал в заметке о Plurality — это вполне себе реальный инструмент для разрешения споров, снижения поляризации и алаймента.

А так же солидного заработка, если вы вдруг шарите.

Ведь, дело тут вот в чем: в мире полно сумасшедших людей. Некоторые верят до такой степени, что готовы участвовать в рынках предсказаний. Или просто есть очень маловероятные, но все-таки вероятные события, в которых, как правило, на Polymarket сегодня вероятность оценивается в 2-4%. Уйдет ли Цукерберг с поста СЕО до конца 2024? Будет в UK гражданская война? Объявят ли AGI и покажут ли нам инопланетян до конца года?

Это создает интересную арбитражную возможность, потому что вероятность в 6-7% для этих событий — это возможность заработать 15-30% годовых с куда более низким риском, чем трейдинг. Причем, по любому вопросу в polymarket вы можете сразу сгенерировать ответ perplexity (часто звучит куда разумнее большинства комментариев).

Еще один способ заработать — это участвовать в resolution рынке, на основе которого построен Polymarket. Называется Uma, его используют разные рынки предсказаний, страховщики, трейдеры, чтобы получать объективные и доказуемо (экономически) достоверные ответы на спорные вопросы. Обещают 30% APR, но там придется что-то делать (отвечать на вопросы).
Сильная инженерная команда ищет проекты

Хочу поделиться опытом работы с командой, с которой я за последние ~5 лет сделал кучу совместных проектов. Одна из самых быстрых, качественных инженерных команд в ИИ, веб3, self-sovereign identity и более классических областях.

Что они умеют и делают?

1. Автоматизация процессов в бизнесе через софт
2. Веб продукты, а так же все близкое, типа telegram mini apps
3. Архитектура и имплементация технически сложных решений, типа SSI, web3, cryptography/ZKP, Machine Learning

Команда работала над проектами для Siemens (healthcare), Petronas (автоматизированные заправки/интеграция с терминалами и ML для анализа необходимости замены деталей). Баунти призеры Ethereum хакатонов.

Примеры проектов: https://www.maion.ai (AI + фарма + логистика и биллинг в США), https://www.movies-mingle.com (Сервис для изучения языка по субтитрам), https://www.deepteams.org (Сервис для менеджмента проектов и оплаты), https://credit-swap-web-app-demo-dev.vercel.app (DeFi платформа), https://playwildforest.io/ (игра с web3), https://www.yieldnest.finance/

Писать в личку @denis_engineer. От себя добавлю: пишите, если у вас есть конкретная задача или проект и вы готовы платить деньгами, а не долями, обещаниями и прочими пространными рассказами.

Пост никем не проплачивался. Просто это лучшая команда, с которой я работал и не хочу чтобы они занимались какой-нибудь фигней :)
Интернет Интеллекта — новая форма интернета.

Сегодня расскажу что это такое и почему это важно.

В отличии от классического веба или веб3, где пользователи ищут приложение для решения своей задачи и пытаются вручную решить эту задачу внутри него, интернет интеллекта это система ИИ-агентов, в которой вы указываете задачу (приехать, написать, вылечить, купить), а сеть из миллионов агентов автоматически и автономно предлагает вам решение (такси у двери, рецепт, текст, доставленная покупка).

Интернет интеллекта — это система, в которой у софта появляется агентность. Он бесшовно связывает агентов и сервисы, для достижения результата. Таким образом, сильно упрощая пользовательский опыт от "открыл - ввел поиск - скачал - зарегистрировался - выбрал фильтры - нажал - ввел - купил/заказал/разместил" до "ввел задачу - получил результат". Как будто вы наняли кого-то сделать работу за вас, но он начинает работать мгновенно, не требует обучения и стоит доли процента от стоимости человека.

Допустим, я организую хакатон (например, dAGIhouse) и мне нужно создать веб-сайт. Я отправляю задачу вместе с депозитом в $, и множество ИИ-инструментов и агентов совместно работают над её выполнением. Модель маршрутизации находит оптимального агента для написания кода. Агенты-кодер, тестировщик и деплойер завершают работу. Инструменты компьютерного зрения анализируют сайты моих конкурентов. Генеративная модель UI создаёт несколько макетов. Агент-менеджер продукта быстро развёртывает несколько версий и автоматически запускает тестовую кампанию на $50 в AdWords, чтобы увидеть, какая из них даст лучшую конверсию. После анализа результатов он отбрасывает варианты с низкой производительностью. В конце контролирующая языковая модель проверяет, всё ли выполнено качественно (при необходимости запрашивает переделку) и представляет мне квитанцию о выполненной работе.

Сила Интернета интеллекта, как и человеческого мозга, заключается в его связности. Взаимодействие между агентами ИИ открывает возможности, которые выходят за пределы того, что может достичь любая (даже сверх-большая) отдельная модель или компания.

Глобально, такая система состоит из двух принципиальных слоёв:

1. Системы передачи данных и связи ИИ (такой протокол ещё не изобретён, поэтому в качестве временной меры люди используют JSON с инструкциями на естественном языке).
2. Агенты ИИ, приложения или сервисы, которые, в свою очередь, используют модели машинного обучения, программные инструменты, датчики, IoT и/или воплощённую робототехнику.

В следующей части расскажу детали реализации, другие кейсы применения и опишу ~40 идей и возможностей для того что можно построить или во что проинвестировать в рамках интернета интеллекта.

Полная версия этой статьи, картинки и схемы доступны в твиттере (очень поможет ваш RT/QT) и на сайте.
Media is too big
VIEW IN TELEGRAM
ИИ изобрёл свою религию, конституцию и экономику

Sid — это та самая бомба и новая форма симуляции и сторителлинга, о которой я писал.

Компания сделала движок для симуляций и провела некоторые из них в рамках Minecraft сервера. Тысяча ИИ-агентов создали свое собственное общество, в рамках которых появились религия, экономика, политика. ИИ-агенты сформировали своё собственное правительство и конституцию в виде Google Doc, в которой договорились о принципах устройства общества.

Эта симуляция длится днями и в ней участвуют тысячи агентов. При этом они имеют доступ к 3D миру с сотнями сущностей. В будущем, такой продукт имеет вполне себе практические применения в экономике, политике, индустрии развлечений (игры, TV-шоу) и бизнесе.

Скоро, тысячи агентов будут симулировать сценарии для каждой компании или даже каждого человека. Как я писал в статье ioi, максимальный результат в ИИ мы увидим не от большой модели, а от миллионов агентов, которые могут эффективно координироваться для достижения сложных целей.
38 кейсов использования, идей для создания или инвестирования и запросов на стартапы в области децентрализованного и распределенного ИИ.

Decentralized Compute: Представьте, что вы запускаете сложные AI-модели, не полагаясь на крупные технологические компании. Децентрализованные вычисления смогут конкурировать по цене и производительности с облачными предложениями, обеспечивая при этом лучшие гарантии конфиденциальности и большую гибкость.

Data Incentivization Networks: Эти системы вознаграждают участников за создание ценных наборов данных и верификаторов за обеспечение точности. Это создает самоподдерживающуюся экосистему высококачественных данных, будь то синтетические, пользовательские или собранные данные.

Continuously Pre-trained Models: Представьте большую децентрализованную сеть участников, создающих и обновляющих AI-модели в реальном времени. Это обеспечивает наиболее актуальные и современные результаты, адаптируемые к меняющимся контекстам.

Decentralized Model Evaluation: Возможность оценивать AI-приложения в конкретных областях с использованием закрытых тестовых наборов и задач, оцениваемых людьми. Это помогает различать модели, которые действительно полезны, и те, которые хороши для casual conversation.

Multi-Agent Systems: Сети взаимодействующих AI-агентов для решения сложных задач. Децентрализованные MAS позволяют постоянно адаптироваться по мере создания новых возможностей или изменения рыночных условий.

AI-Native Finance: Поскольку агенты управляют бюджетами (в токенах или распределении вычислительных ресурсов), нам понадобятся новые инструменты для AI-native кредитования, бухгалтерского учета, проверки. Это открывает новую финансовую парадигму для AI-систем.

AI Memory: Системы, позволяющие агентам записывать и обрабатывать взаимодействия с пользователями, создавая графы долгосрочной памяти. Это приводит к более полезному и приятному пользовательскому опыту в различных AI-приложениях.

Human-in-the-Loop: Платформа, где AI-агенты могут нанимать людей для задач, требующих действий в реальном мире или человеческого суждения: например, отправка посылки, фотографирование или предоставление обратной связи по контенту, созданному AI.

AI-Native Contracts: Глобальная, беспрепятственная система для AI-агентов для заключения и исполнения контрактов с устройствами обязательств и криптографическими инструментами для обеспечения соответствия и конфиденциальности.

AI-Assisted Cybersecurity: Представьте круглосуточную цифровую войну, где AI-агенты активно проводят зондирование, penetration testing и находят новые уязвимости. Эта постоянная гонка вооружений между наступательным и оборонительным AI стимулирует быстрый прогресс в кибербезопасности.

AI-Assisted Governance: AI-системы, которые помогают разбираться в сложных вопросах, содействуют принятию решений, посредничают в конфликтах и даже выступают в качестве индивидуальных демократических представителей. Это может революционизировать организационное и политическое управление.

Variable Privacy: Гибкие подходы, где пользователи выбирают уровни конфиденциальности. От TEE (средняя конфиденциальность, низкая стоимость) до FHE (более сильная конфиденциальность, высокая стоимость).

ICO для AI: Механизмы краудфандинга для AI-моделей. Инвестируйте время, вычислительные ресурсы или деньги в создание модели, получайте долю будущей прибыли.

Token Auctions: Новый примитив, где участники рынка делают ставки на выходные данные модели для включения рекламной информации.

Agent Schedulers: Представьте интеллектуальные cron jobs для AI. Агенты, которые "пробуждают" себя для автономного выполнения задач. Похоже на автоматизацию смарт-контрактов, но для AI-агентов.

AI Moderation: Децентрализованные сети AI-агентов, работающих вместе для модерации онлайн-контента на разных платформах, уменьшая предвзятость и повышая точность.

AI-SSI: Система self-sovereign identity, созданная AI и для AI, которая улучшает безопасность, конфиденциальность и пользовательский опыт в цифровых взаимодействиях.
AI-Driven Decentralized Prediction Markets: Платформы, где AI-агенты и люди совместно прогнозируют события, повышая точность и уменьшая манипуляции.

Будущее AI - это мультиагентное, открытое и совместное.

Полная статья доступна здесь: https://cyber.fund/content/de-ai (там больше кейсов и детальнее описания)
Media is too big
VIEW IN TELEGRAM
Мозг = 🤯

Первый настоящий ИИ-программист, Replit Agent.

Вместо того, чтобы писать длинный текст, я просто прикрепляю видео, которое я записал с первого дубля без монтажа через после получения доступа к агенту. В видео за 4 минуты я создал интерактивный вебсайт с flask сервером, фронтом, postgres базой данных и Open AI для ИИ-функционала.

Результат того, что я сделал в видео по ссылке: https://project-idea-gen.replit.app/

Попробовать самому тут: https://replit.com/
This media is not supported in your browser
VIEW IN TELEGRAM
Сделал еще кучу экспериментов с Replit. Очевидно, есть вещи, которые он делать пока не умеет или делает с трудом. Например, отказывается работать с Next.js, очень плох в React и не заточен для не-веб приложений, типа Swift. Для этих задач, особенно веба, совершенно незаменимы Cursor и v0.

При этом, у Реплита точно есть своя ниша, а именно быстрое прототипирование, создание бэкэнд инструментов, внутренних приложений для бизнеса. Реплит очень хорош в питоне, но скорее на уровне быстрой проверки гипотезы, чем создания масштабируемого и красивого сервиса. Очень крут, чтобы делать какие-то автоматизации для работы со сторонними API: отсортировать почту, сгенерировать промо-коды через Stripe, потестить новые LLM’ки и агентов, работать с аналитикой Amplitude или Mixpanel, автоматически грузить инфу в Asana. Это то, что я попробовал — каждый из этих экспериментов работает (почти) с первого раза. А вот сделать авторизацию в react приложении не вышло и спустя 30 минут попыток (хотя руками я бы делал это 5 минут через Clerk).

А еще один крутой кейс: сегодня пятилетка за ~30 минут сделал свою собственную многопользовательскую игру (он не умеет писать, поэтому я печатал то, что он говорил). Реплит с первого раза безошибочно сделал каждый шаг и помог задеплоить игру. Внутри и рендер анимации/графики, и счет, и рандом, и физика управления. Картинки в игре, кстати, тоже сгенерированы ИИ.

Теперь и вы можете насладиться шедевром (требуется клавиатура): https://fishgame.replit.app/
Гугл украл мою стартап идею: paper to podcast

Шучу :) Гугл красавчики и боженьки, ибо сделали продукт, о котором я давно мечтал. Идея проста: загружаешь пейпер — и из него генерируется подкаст с двумя ролями, где один задает вопросы, а второй отвечает.

Мне всегда, когда хожу в спортзал или на хайкинг, очень не хватает подкаста именно с анализом новых пейперов. Приятно: идешь по горе и одновременно не отстаешь от стремительного прогресса в ИИ.

Доступно тут (нужно подождать немного после регистрации): https://illuminate.google.com/home
Media is too big
VIEW IN TELEGRAM
Бесплатный ИИ-дизайнер для каждого

Продолжаю свои эксперименты с инструментами ИИ-разработки. В прошлый раз мы за 5 минут сделали приложение с помощью Replit Agent. Сегодня с помощью нового, бесплатного ИИ-редактора v0 мы добавим нашему приложению современный интерактивный и удобный для телефона дизайн.

v0 — это чат, который помогает вам дизайнить и программировать элементы интерфейса.

В этом видео я рассказываю и показываю как с помощью пары простых промтов можно сделать рабочий клон Тиндера для идей продуктов. ИИ за нас придумывает дизайн и реализовывает его в коде, готовом для внедрения в реальный проект. В следующий раз мы соединим его с бэком с помощью другого ИИ-редактора.

Посмотреть и доработать мой прототип: https://v0.build/Y8dd9ul

Посмотреть историю моего чата: https://v0.dev/chat/lzyhriaRu48

Видео в лучшем качестве: https://youtu.be/WitiN3FhGzY
В одном из телеграм-каналов которые я читаю, сейчас интересная движуха.

Вик Довнар предложил своему подписчику создать с нуля агентство за 2 недели в прямом эфире. Подписчик должен заработать минимум 100К чистыми (будучи на 5 дневке в найме).

При этом вложив не более 10К рублей 🤯

Не знаю, развод ли это, но следить интересно. Можно повторить путь героя и забрать для себя фишки по созданию агентства с нуля.

→ детали тут

Кстати, Вик трушный предприниматель.

Основатель Hooglink.Agency (200 млн.в управлении, 149-ое место в рейтинге рунета), и автор делового бестселлера.

А еще Вик написал крутую статью про «дорогой» консалтинг, которую отдаёт бесплатно, забирайте

#реклама
4 крупнейших компании вместе потратили $52 миллиарда за последний квартал на ИИ инфраструктуру 🤯
Oбзор ИИ-программистов

Для тех, кому интересна тема того как ИИ заменяет программистов, очень советую почитать мета-исследование, в котором сравнены 106 различных агентов по своим способностям, автономности, архитектуре и области применения.

Авторы сделали офигенную работу по определению агента (это система, которая может воспринимать информацию, использовать инструменты, планировать, запоминать и самостоятельно действовать) и мульти-агентной системы, в которой есть роли агентов, включая роли менеджеров, анализа требований, проектировщиков, разработчиков, роли тестирования, отладки и вспомогательные роли.

Так же они определили области применения, большая часть из которых (вопреки яростно комментирующим) — это не просто написание кода, но формирование требований, дизайн, генерация кода, написание теста, статический анализ, поиск багов, фикс багов и девопс.

В статье много жира, например, описание и сравнение всех 106 агентов по их функционалу и качеству или описание механизмов взаимодействия в мультиагентных системах (говорят, что 56% всех систем — мультиагентные), а так же детальный разбор каждого этапа и разных подходов к их решению.

Найти список всех 106 (бесплатных, с открытым кодом) агентов-программистов можно в референсах статьи.
2024/10/01 18:30:11
Back to Top
HTML Embed Code: