Telegram Web Link
О предсказаниях

Комментарии под последним постом оказались прямо в тему — ту, о которой я хотел рассказать. А именно, о рынках предсказаний в принятии решений в политике и бизнесе.

Простой пример: я рассказал о роботе, тут же в фейсбуке и телеграме появились мнения, что это нифига не робот, а человек в костюме. Я предложил спор на $10,000, в результате которого, если окажется, что робот реально способен на все эти движения, то я выигрываю обе ставки. Пока никто не согласился. (речь не о том как обучают робота, а кто под одеждой: человек или машина)

Это игрушечный пример для борьбы со срачами в комментариях и щитпстингом, но как я писал в заметке о Plurality — это вполне себе реальный инструмент для разрешения споров, снижения поляризации и алаймента.

А так же солидного заработка, если вы вдруг шарите.

Ведь, дело тут вот в чем: в мире полно сумасшедших людей. Некоторые верят до такой степени, что готовы участвовать в рынках предсказаний. Или просто есть очень маловероятные, но все-таки вероятные события, в которых, как правило, на Polymarket сегодня вероятность оценивается в 2-4%. Уйдет ли Цукерберг с поста СЕО до конца 2024? Будет в UK гражданская война? Объявят ли AGI и покажут ли нам инопланетян до конца года?

Это создает интересную арбитражную возможность, потому что вероятность в 6-7% для этих событий — это возможность заработать 15-30% годовых с куда более низким риском, чем трейдинг. Причем, по любому вопросу в polymarket вы можете сразу сгенерировать ответ perplexity (часто звучит куда разумнее большинства комментариев).

Еще один способ заработать — это участвовать в resolution рынке, на основе которого построен Polymarket. Называется Uma, его используют разные рынки предсказаний, страховщики, трейдеры, чтобы получать объективные и доказуемо (экономически) достоверные ответы на спорные вопросы. Обещают 30% APR, но там придется что-то делать (отвечать на вопросы).
Сильная инженерная команда ищет проекты

Хочу поделиться опытом работы с командой, с которой я за последние ~5 лет сделал кучу совместных проектов. Одна из самых быстрых, качественных инженерных команд в ИИ, веб3, self-sovereign identity и более классических областях.

Что они умеют и делают?

1. Автоматизация процессов в бизнесе через софт
2. Веб продукты, а так же все близкое, типа telegram mini apps
3. Архитектура и имплементация технически сложных решений, типа SSI, web3, cryptography/ZKP, Machine Learning

Команда работала над проектами для Siemens (healthcare), Petronas (автоматизированные заправки/интеграция с терминалами и ML для анализа необходимости замены деталей). Баунти призеры Ethereum хакатонов.

Примеры проектов: https://www.maion.ai (AI + фарма + логистика и биллинг в США), https://www.movies-mingle.com (Сервис для изучения языка по субтитрам), https://www.deepteams.org (Сервис для менеджмента проектов и оплаты), https://credit-swap-web-app-demo-dev.vercel.app (DeFi платформа), https://playwildforest.io/ (игра с web3), https://www.yieldnest.finance/

Писать в личку @denis_engineer. От себя добавлю: пишите, если у вас есть конкретная задача или проект и вы готовы платить деньгами, а не долями, обещаниями и прочими пространными рассказами.

Пост никем не проплачивался. Просто это лучшая команда, с которой я работал и не хочу чтобы они занимались какой-нибудь фигней :)
Интернет Интеллекта — новая форма интернета.

Сегодня расскажу что это такое и почему это важно.

В отличии от классического веба или веб3, где пользователи ищут приложение для решения своей задачи и пытаются вручную решить эту задачу внутри него, интернет интеллекта это система ИИ-агентов, в которой вы указываете задачу (приехать, написать, вылечить, купить), а сеть из миллионов агентов автоматически и автономно предлагает вам решение (такси у двери, рецепт, текст, доставленная покупка).

Интернет интеллекта — это система, в которой у софта появляется агентность. Он бесшовно связывает агентов и сервисы, для достижения результата. Таким образом, сильно упрощая пользовательский опыт от "открыл - ввел поиск - скачал - зарегистрировался - выбрал фильтры - нажал - ввел - купил/заказал/разместил" до "ввел задачу - получил результат". Как будто вы наняли кого-то сделать работу за вас, но он начинает работать мгновенно, не требует обучения и стоит доли процента от стоимости человека.

Допустим, я организую хакатон (например, dAGIhouse) и мне нужно создать веб-сайт. Я отправляю задачу вместе с депозитом в $, и множество ИИ-инструментов и агентов совместно работают над её выполнением. Модель маршрутизации находит оптимального агента для написания кода. Агенты-кодер, тестировщик и деплойер завершают работу. Инструменты компьютерного зрения анализируют сайты моих конкурентов. Генеративная модель UI создаёт несколько макетов. Агент-менеджер продукта быстро развёртывает несколько версий и автоматически запускает тестовую кампанию на $50 в AdWords, чтобы увидеть, какая из них даст лучшую конверсию. После анализа результатов он отбрасывает варианты с низкой производительностью. В конце контролирующая языковая модель проверяет, всё ли выполнено качественно (при необходимости запрашивает переделку) и представляет мне квитанцию о выполненной работе.

Сила Интернета интеллекта, как и человеческого мозга, заключается в его связности. Взаимодействие между агентами ИИ открывает возможности, которые выходят за пределы того, что может достичь любая (даже сверх-большая) отдельная модель или компания.

Глобально, такая система состоит из двух принципиальных слоёв:

1. Системы передачи данных и связи ИИ (такой протокол ещё не изобретён, поэтому в качестве временной меры люди используют JSON с инструкциями на естественном языке).
2. Агенты ИИ, приложения или сервисы, которые, в свою очередь, используют модели машинного обучения, программные инструменты, датчики, IoT и/или воплощённую робототехнику.

В следующей части расскажу детали реализации, другие кейсы применения и опишу ~40 идей и возможностей для того что можно построить или во что проинвестировать в рамках интернета интеллекта.

Полная версия этой статьи, картинки и схемы доступны в твиттере (очень поможет ваш RT/QT) и на сайте.
Media is too big
VIEW IN TELEGRAM
ИИ изобрёл свою религию, конституцию и экономику

Sid — это та самая бомба и новая форма симуляции и сторителлинга, о которой я писал.

Компания сделала движок для симуляций и провела некоторые из них в рамках Minecraft сервера. Тысяча ИИ-агентов создали свое собственное общество, в рамках которых появились религия, экономика, политика. ИИ-агенты сформировали своё собственное правительство и конституцию в виде Google Doc, в которой договорились о принципах устройства общества.

Эта симуляция длится днями и в ней участвуют тысячи агентов. При этом они имеют доступ к 3D миру с сотнями сущностей. В будущем, такой продукт имеет вполне себе практические применения в экономике, политике, индустрии развлечений (игры, TV-шоу) и бизнесе.

Скоро, тысячи агентов будут симулировать сценарии для каждой компании или даже каждого человека. Как я писал в статье ioi, максимальный результат в ИИ мы увидим не от большой модели, а от миллионов агентов, которые могут эффективно координироваться для достижения сложных целей.
38 кейсов использования, идей для создания или инвестирования и запросов на стартапы в области децентрализованного и распределенного ИИ.

Decentralized Compute: Представьте, что вы запускаете сложные AI-модели, не полагаясь на крупные технологические компании. Децентрализованные вычисления смогут конкурировать по цене и производительности с облачными предложениями, обеспечивая при этом лучшие гарантии конфиденциальности и большую гибкость.

Data Incentivization Networks: Эти системы вознаграждают участников за создание ценных наборов данных и верификаторов за обеспечение точности. Это создает самоподдерживающуюся экосистему высококачественных данных, будь то синтетические, пользовательские или собранные данные.

Continuously Pre-trained Models: Представьте большую децентрализованную сеть участников, создающих и обновляющих AI-модели в реальном времени. Это обеспечивает наиболее актуальные и современные результаты, адаптируемые к меняющимся контекстам.

Decentralized Model Evaluation: Возможность оценивать AI-приложения в конкретных областях с использованием закрытых тестовых наборов и задач, оцениваемых людьми. Это помогает различать модели, которые действительно полезны, и те, которые хороши для casual conversation.

Multi-Agent Systems: Сети взаимодействующих AI-агентов для решения сложных задач. Децентрализованные MAS позволяют постоянно адаптироваться по мере создания новых возможностей или изменения рыночных условий.

AI-Native Finance: Поскольку агенты управляют бюджетами (в токенах или распределении вычислительных ресурсов), нам понадобятся новые инструменты для AI-native кредитования, бухгалтерского учета, проверки. Это открывает новую финансовую парадигму для AI-систем.

AI Memory: Системы, позволяющие агентам записывать и обрабатывать взаимодействия с пользователями, создавая графы долгосрочной памяти. Это приводит к более полезному и приятному пользовательскому опыту в различных AI-приложениях.

Human-in-the-Loop: Платформа, где AI-агенты могут нанимать людей для задач, требующих действий в реальном мире или человеческого суждения: например, отправка посылки, фотографирование или предоставление обратной связи по контенту, созданному AI.

AI-Native Contracts: Глобальная, беспрепятственная система для AI-агентов для заключения и исполнения контрактов с устройствами обязательств и криптографическими инструментами для обеспечения соответствия и конфиденциальности.

AI-Assisted Cybersecurity: Представьте круглосуточную цифровую войну, где AI-агенты активно проводят зондирование, penetration testing и находят новые уязвимости. Эта постоянная гонка вооружений между наступательным и оборонительным AI стимулирует быстрый прогресс в кибербезопасности.

AI-Assisted Governance: AI-системы, которые помогают разбираться в сложных вопросах, содействуют принятию решений, посредничают в конфликтах и даже выступают в качестве индивидуальных демократических представителей. Это может революционизировать организационное и политическое управление.

Variable Privacy: Гибкие подходы, где пользователи выбирают уровни конфиденциальности. От TEE (средняя конфиденциальность, низкая стоимость) до FHE (более сильная конфиденциальность, высокая стоимость).

ICO для AI: Механизмы краудфандинга для AI-моделей. Инвестируйте время, вычислительные ресурсы или деньги в создание модели, получайте долю будущей прибыли.

Token Auctions: Новый примитив, где участники рынка делают ставки на выходные данные модели для включения рекламной информации.

Agent Schedulers: Представьте интеллектуальные cron jobs для AI. Агенты, которые "пробуждают" себя для автономного выполнения задач. Похоже на автоматизацию смарт-контрактов, но для AI-агентов.

AI Moderation: Децентрализованные сети AI-агентов, работающих вместе для модерации онлайн-контента на разных платформах, уменьшая предвзятость и повышая точность.

AI-SSI: Система self-sovereign identity, созданная AI и для AI, которая улучшает безопасность, конфиденциальность и пользовательский опыт в цифровых взаимодействиях.
AI-Driven Decentralized Prediction Markets: Платформы, где AI-агенты и люди совместно прогнозируют события, повышая точность и уменьшая манипуляции.

Будущее AI - это мультиагентное, открытое и совместное.

Полная статья доступна здесь: https://cyber.fund/content/de-ai (там больше кейсов и детальнее описания)
Media is too big
VIEW IN TELEGRAM
Мозг = 🤯

Первый настоящий ИИ-программист, Replit Agent.

Вместо того, чтобы писать длинный текст, я просто прикрепляю видео, которое я записал с первого дубля без монтажа через после получения доступа к агенту. В видео за 4 минуты я создал интерактивный вебсайт с flask сервером, фронтом, postgres базой данных и Open AI для ИИ-функционала.

Результат того, что я сделал в видео по ссылке: https://project-idea-gen.replit.app/

Попробовать самому тут: https://replit.com/
This media is not supported in your browser
VIEW IN TELEGRAM
Сделал еще кучу экспериментов с Replit. Очевидно, есть вещи, которые он делать пока не умеет или делает с трудом. Например, отказывается работать с Next.js, очень плох в React и не заточен для не-веб приложений, типа Swift. Для этих задач, особенно веба, совершенно незаменимы Cursor и v0.

При этом, у Реплита точно есть своя ниша, а именно быстрое прототипирование, создание бэкэнд инструментов, внутренних приложений для бизнеса. Реплит очень хорош в питоне, но скорее на уровне быстрой проверки гипотезы, чем создания масштабируемого и красивого сервиса. Очень крут, чтобы делать какие-то автоматизации для работы со сторонними API: отсортировать почту, сгенерировать промо-коды через Stripe, потестить новые LLM’ки и агентов, работать с аналитикой Amplitude или Mixpanel, автоматически грузить инфу в Asana. Это то, что я попробовал — каждый из этих экспериментов работает (почти) с первого раза. А вот сделать авторизацию в react приложении не вышло и спустя 30 минут попыток (хотя руками я бы делал это 5 минут через Clerk).

А еще один крутой кейс: сегодня пятилетка за ~30 минут сделал свою собственную многопользовательскую игру (он не умеет писать, поэтому я печатал то, что он говорил). Реплит с первого раза безошибочно сделал каждый шаг и помог задеплоить игру. Внутри и рендер анимации/графики, и счет, и рандом, и физика управления. Картинки в игре, кстати, тоже сгенерированы ИИ.

Теперь и вы можете насладиться шедевром (требуется клавиатура): https://fishgame.replit.app/
Гугл украл мою стартап идею: paper to podcast

Шучу :) Гугл красавчики и боженьки, ибо сделали продукт, о котором я давно мечтал. Идея проста: загружаешь пейпер — и из него генерируется подкаст с двумя ролями, где один задает вопросы, а второй отвечает.

Мне всегда, когда хожу в спортзал или на хайкинг, очень не хватает подкаста именно с анализом новых пейперов. Приятно: идешь по горе и одновременно не отстаешь от стремительного прогресса в ИИ.

Доступно тут (нужно подождать немного после регистрации): https://illuminate.google.com/home
Media is too big
VIEW IN TELEGRAM
Бесплатный ИИ-дизайнер для каждого

Продолжаю свои эксперименты с инструментами ИИ-разработки. В прошлый раз мы за 5 минут сделали приложение с помощью Replit Agent. Сегодня с помощью нового, бесплатного ИИ-редактора v0 мы добавим нашему приложению современный интерактивный и удобный для телефона дизайн.

v0 — это чат, который помогает вам дизайнить и программировать элементы интерфейса.

В этом видео я рассказываю и показываю как с помощью пары простых промтов можно сделать рабочий клон Тиндера для идей продуктов. ИИ за нас придумывает дизайн и реализовывает его в коде, готовом для внедрения в реальный проект. В следующий раз мы соединим его с бэком с помощью другого ИИ-редактора.

Посмотреть и доработать мой прототип: https://v0.build/Y8dd9ul

Посмотреть историю моего чата: https://v0.dev/chat/lzyhriaRu48

Видео в лучшем качестве: https://youtu.be/WitiN3FhGzY
В одном из телеграм-каналов которые я читаю, сейчас интересная движуха.

Вик Довнар предложил своему подписчику создать с нуля агентство за 2 недели в прямом эфире. Подписчик должен заработать минимум 100К чистыми (будучи на 5 дневке в найме).

При этом вложив не более 10К рублей 🤯

Не знаю, развод ли это, но следить интересно. Можно повторить путь героя и забрать для себя фишки по созданию агентства с нуля.

→ детали тут

Кстати, Вик трушный предприниматель.

Основатель Hooglink.Agency (200 млн.в управлении, 149-ое место в рейтинге рунета), и автор делового бестселлера.

А еще Вик написал крутую статью про «дорогой» консалтинг, которую отдаёт бесплатно, забирайте

#реклама
4 крупнейших компании вместе потратили $52 миллиарда за последний квартал на ИИ инфраструктуру 🤯
Oбзор ИИ-программистов

Для тех, кому интересна тема того как ИИ заменяет программистов, очень советую почитать мета-исследование, в котором сравнены 106 различных агентов по своим способностям, автономности, архитектуре и области применения.

Авторы сделали офигенную работу по определению агента (это система, которая может воспринимать информацию, использовать инструменты, планировать, запоминать и самостоятельно действовать) и мульти-агентной системы, в которой есть роли агентов, включая роли менеджеров, анализа требований, проектировщиков, разработчиков, роли тестирования, отладки и вспомогательные роли.

Так же они определили области применения, большая часть из которых (вопреки яростно комментирующим) — это не просто написание кода, но формирование требований, дизайн, генерация кода, написание теста, статический анализ, поиск багов, фикс багов и девопс.

В статье много жира, например, описание и сравнение всех 106 агентов по их функционалу и качеству или описание механизмов взаимодействия в мультиагентных системах (говорят, что 56% всех систем — мультиагентные), а так же детальный разбор каждого этапа и разных подходов к их решению.

Найти список всех 106 (бесплатных, с открытым кодом) агентов-программистов можно в референсах статьи.
Идея о том, что человек без опыта программирования, но с ИИ, может работать лучше, чем опытный инженер, абсурдна.

Как и идея о том, что ИИ в какой-то момент не превзойдет любого живого человека в программировании.
Если ИИ решает задачу программирования, то это автоматически решает любую другую проблему.

Я не говорю, что это позволит нарушить законы физики, но практически все short of. Именно поэтому в своих примитивных экспериментах и более исследовании я в первую очередь фокусируюсь на моделях и агентах, способных автоматизировать программирование.

И в этом смысле не так велика разница между моделью, которая идеально и с первого раза может придумать и создать любую программу и полноценным AGI. Любая задача взаимодействия с физическим миром (роборукой взять ручку со стола, помыть унитаз, поймать и отшлепать всех негодяев мира, построить оптимальную экономическую систему, координировать рынки) — это инженерная задача, которая состоит из понятных нам компонентов: reasoning, планирование, computer vision, дизайн механизмов и криптография, список можно продолжать бесконечно.

Вчера, например, немного посмотрел две независимые статьи, в которых показывается как LLM *текущего* уровня в состоянии создавать новые идеи и проводить научные исследования. В широко разошедшемся первом LLM научилась генерировать реально новые идеи для исследований, которые были оценены экспертами-людьми (тут пересказ и критика). Во втором, от MIT, мультиагентная ИИ система генерирует и уточненяет научные гипотезы используя онтологический граф. То есть, она умеет соединять не связанные области знания для решения сложных междисциплинарных задач.

А параллельно с этим крутейший прогресс в LLM для кодинга. Magic, поднявшие 450М от Нэта Фридмана и всех топовых фондов, сделали модель для кодинга с 100M токенами в контексте. Вы можете загрузить в нее ~1000 книг и попросить пересказать их все. Если сегодняшие агенты и модели показывают 30-40% на теста по решению реальных сложных задач в программировании, то цель Magic — это 99.9%. Попросил написать свою собственную операционную систему, пошел пообедать и получил результат.

Работаем и ускоряемся.
Каждый ускоряется как умеет. Oracle вот строит дата-центр на гигаватт, который будут питать 3 небольших ядерных реактора. Ибо у кого есть ИИ, тот контролирует мир, а остальным показывают красивые картинки, чтобы не верещали 😹
This media is not supported in your browser
VIEW IN TELEGRAM
Каждый ускоряется как умеет (видео не ускорено). Вот эта платформа выдает инференс Llama-3.1-8B/70B/405B (без квантизации) аж до 1200 ток/сек.

А ваш синьор так умеет? Одно из преимуществ LLM не только в том, что они могут держать в голове сотню тысяч страниц информации, но и в том, что за несколько секунд они могут попробовать тысячи способов решения проблемы и понять какие из них не работают.
Ну что, дождались! OpenAI выкатил новую супер-модель.

o1 отличается от предыдущих моделей встроенной способностью к "рассуждениям" (reasoning). В модель "вшита" способность к логическим выводам и самокритике/саморефлексии через chain of thought. Полный отчет по модели можно скачать тут. Модель уже доступна для всех разработчиков с доступом к API tier-5, но скоро будет доступна и в бесплатной версии GPT.

Выводы:

1. Скейлинг работает. Больше денег, больше данных = круче модель. Ужасные рассказы о том, что LLM уперлись в потолок снова оказались просто разговорами. Вместо скейлинга pre-training, теперь скейлится test time compute (то бишь инференс).

2. В точных задачах, типа математики o1 показывается в 7-8 раз круче результаты, чем gpt4o. В коде — в 8-9 раз. В задачкаъ по химии, физике — около 15% прироста.

3. OpenAI прямо зуб дают, что математические способности o1 не хуже, чем у победителя международной олимпиады по математике, а по точным наукам типа физики она работает не хуже кандидата наук.

4. В принципе, закиданный всеми на прошлой неделе в твиттере помидорами Reflection70B делал то же самое. Но не сделал. А Сэм — мужик. Сэм взял и сделал.

5. Стоит $60 за миллион токенов, а значит интеллект у нас теперь достанется только богатым.

6. Это пока что дорогая и медленная модель. Но именно используя эту новую парадигму ("думай, а потом говори"), OpenAI за ближайшие годы сделает o1 в десятки или даже сотни раз дешевле, быстрее и умнее.

7. "o1 думает, но думает несколько секунд. в будущих версиях она будет думать над сложными задачами несколько часов, дней или даже недель" OpenAI
2024/10/03 23:23:35
Back to Top
HTML Embed Code: