Telegram Web Link
Если бы Кен Уилбер был GP венчурного фонда...

Note that there's no clear borders. Правая половина (почти) всегда строится на левой.

1. Most of robotics will have AI component to make decisions, actions. etc.
2. Most network state will use web3 infra for money, voting, etc.
GPT5?

Вчера было 8+ часов звонков нон-стоп и я пропустил весь хайп про Q*

Кто не в курсе: есть теория заговора гипотеза, что одной из причин увольнения Альтмана был якобы какой-то лютый прогресс в работе над новой моделью, который скрыли от борда.

И якобы эта модель работает не через авторегрессию (генерация исключительно следующего токена в тексте), а через планирование и контроль, то есть модель сначала думает, а потом говорит.

И, более того, якобы это обучено на архитектуре на основе архитектуры Q-Learning, то есть когда модель (агент) учится исследуя мир вокруг и получая подкрепление (reinforcement learning) делая более "правильные" действия. Так примерно работают модели типа AlphaGo или AlphaStar, которые учатся с нуля играть в сложные игры. Если у LLM, как у самурая, есть только путь (они не знает какое слово будет следующим в предложении), то у таких моделей есть целеполагание, что, в целом, классная фича.

Ну а "*" потенциально относится к алгоритму поиска под названием "A*", который очень эффективно позволяет найти кратчайший путь до цели. Например, в случае, когда сложная математическая задача делится на кучу промежуточных шагов и логических выводов.

Честно говоря, это первый раз в истории, когда интернет умудрился восстановить архитектуру ML модели исключительно по названию, но интернет любит теории заговора и шизотерику.

Я не сомневаюсь, что OAI, Google, Meta и все остальные безусловно работают над моделями, которые могут самообучаться и планировать решение задач. Наверняка у OAI даже есть проект с таким названием, но насколько он работает и для каких задач мы пока ничего не знаем.

Почитать больше теорий и мемов от ML-тусовки можно, например, тут.
Будущее ритейла и маркетинга с ИИ

Очень интересный скриншот(от классного автора) про будущее ритейла.

Дано: теперь у каждого человека на планете есть личный ассистент, который, например, во время распродажи может по скриншоту или фотографии из магазина оценить качество бренда и то насколько скидка на ценнике является истинной по сравнению с оригинальной ценой. Это не требует никакой когнитивной нагрузки на покупателя, но приводит к выравниванию рынка: теперь много маркетинговых ходов (типа завысить цену и поставить огромную скидку) работать не будут.

С другой стороны, открывается новый класс продуктов в маркетинге под названием AIO (Artificial Intelligence Optimization), где используя трюки, промт инжекшен (третий скриншот) специалисты могут умышленно повышать качество ответа ассистентов для своих владельцев-покупателей.

Это я уже не говорю про то, что SEO как индустрия фактически переросла в индустрию по генерации текстов на лету, как для людей, так и для краулеров.
Прекрасный слайд от Виталика на конфе о программируемой криптографии. Доклад называется d/acc, речь о defensive / decentralized accelerationism.

Но именно мне понравилась правая часть графика. Очень ёмко описывает парадигму совеременной цифровой безопаности.

Если мы знаем кто атакующий, то это кибербезопасность (крипта и прочий SSL, аудит, пентест, стандартный набор).

Если мы не знаем кто атакующий, то это инфобезопаность, то есть попытка выяснить истину (например, x.com community notes и алгоритмы консенсуса)
Андрей Карпаты (один из ключевых людей в OpenAI) недавно записал часовую лекцию про то, как работают LLM (большие языковые модели типа GPT-4), какие у них ограничения и какие перспективы.

В этом видео настолько хорошо все объясняется, что если раньше ChatGPT казался мне магией, то теперь мне кажется, что я примерно понял, как он работает и какие у него ограничения. За три дня видео посмотрели уже 500 тысяч раз, поэтому я решил упороться и сделать его выжимку на русском языке на VC.

Потратил несколько часов, поэтому большая просьба: поставьте, пожалуйста, сердечко на VC, чтобы статью увидело больше людей!

https://vc.ru/chatgpt/931112-vvedenie-v-llm-dlya-teh-kto-vse-propustil-vyzhimka-video-andreya-karpaty-so-osnovatelya-openai

PS. Также можете писать здесь в комменты, если найдете какие-то опечатки или косяки
Теперь и вы можете написать экспериментальный джаз пост-панк хит сидя на скучном зум звонке!
Зайчата
Dreams and Robots
Как получить от Суно законченную песню с нужной вам структурой:

1. Старайтесь соблюдать размер в стихах. Если ваш текст сложно петь, получится речитатив независимо от жанра. Если вы сделаете в припеве и куплете разные размеры, то Суно будет проще придумать между ними переходы. Между соседними куплетами вставляйте пустую строку, получится пауза.

2. Ударения в словах можно выделять большой буквой, вот так: "ПоросЯтам". Когда это не работает, измените само слово: вместо "прямЫ" напишите "примЫ". Иногда помогает разбить слово на две части, вместо "элЕктрогенератор" написать "элЕктро генерАтор".

3. В круглых скобках можно добавлять бэк-вокал. Неплохо работают звуки типа (О-о-о, у-у-у-у).

4. Размечайте песню тегами. Точно работают: [Verse], [Chorus], [Bridge], [Solo]. К Соло иногда можно добавлять конкретику, например [Piano solo], но это может изменить инструменты всей песни. [Coda] помогает сделать концовку. С переменным успехом у меня работали [Calm] и [Aggressive]. Надо экспериментировать с другими тегами в квадратных скобках.

5. Иногда можно кастомизировать жанр, добавляя слова типа Energetic, Rhythmic, Aggressive, Slow, Fast. Обязательно пишите With Female/Male vocals, чтобы избежать инструментала и указать пол певца (тоже не всегда срабатывает). Разработчики не рекомендуют смешивать разные жанры, но, например, Chiptune Punk мне очень зашёл.

6. Максимальный размер одной генерации 1:20. Когда вам понравился кусок, выбирайте меню с тремя точками и пункт "Continue fom this clip". В тексте оставьте только те строки, которые не влезли в прошлый фрагмент, и нажимайте Generate. Так можно делать несколько раз, например у вас может быть три-четыре таких последовательных фрагмента. В самом конце в меню выбирайте пункт "Get Whole Song" и песня склеится из всех фрагментов.

К сожалению нельзя перегенерировать только кусок песни, поменяв что-то локально в тексте. Поэтому приходится прощать мелкие ошибки или править результат в вашем DAW.

Песни пишутся здесь в пункте Create (Custom):
https://app.suno.ai/

#suno
Всегда сложно сделать выбор, что читать, когда вокруг так много бизнес-книг.

Павел Анненков — предприниматель и инвестор с 19-летним опытом сам ведет Telegram канал, где пишет обзоры на лучшие бизнес-книги и нон-фикшн литературу. А еще делится своим опытом и идеями для развития бизнеса.

Теперь вы точно будете знать, что важно прочитать и при этом не потратить время впустую на проходные и неинтересные книги.

Это не типичный канал с банальными и заезженными книгами и советами. Загляните и убедитесь в этом сами — ANNENKOV_ideas_and_books

#реклама
О приватном и децентрализованном ИИ (бизнес-кейсы использования)

Цель ИИ — принести нам избыток, пост-дефицит, в тысячи раз увеличив объём интеллекта на планете. Крипта же, наоборот, про строгость ограничения, про защиту данных, денег и гарантию приватности.

Последние полгода я периодически пишу о соединении технологий искусственного интеллекта и крипты (криптографии). Сегодня говорим о применимости ZKML (zero-knowledge machine learning), то есть технологии запуска ИИ моделей с гарантией неразглашения информации.

Глобально у нас есть три способа использования ML/AI в приватной форме для решения различных задач.

1) Вы продаёте доступ к модели, сохраняя её приватной

— маркетплейс моделей (я сделал GPT для грибников, продам один вызов за $0.001) и маркетплейс файн-тьюнингов и Лор (я натьюнил модель генерировать красивое видео или писать стихи в стиле Пушкина, продаю каждый вызов). В обоих случаях веса модели остаются приватными, но покупатель получает криптографическую гарантию что это именно та модель.

— маркетплейс данных для тренировки (я даю вам возможность использовать свои данные для тренировки модели, но вы ни в один момент времени не видите данные)

— доказательство аутентичности генерации (я могу доказать (всегда в этом посте слово “доказать” значит сгенерировать математический zk proof) что эта картинка или текст созданы именно моей моделью именно сейчас)

2) Публичные модели с публичными данными aka trustless AI

Это доказуемые ML алгоритмы в публичных сервисах. Например:

— использование нейронок для торговых стратегий ончейн без разглашения стратегии, но с возможностью доказать любые параметры этой стратегии (в тусовке такое называют zkAMM)

— использование нейронок для генерации рекомендаций (например, в децентрализованных социальных сетях) с возможностью аудировать, но не манипулировать алгоритмом

3) Приватность данных

Отправляя в публичные модели zk пруфы вместо сырых данных, вы получаете:

— Гарантию аутентификации без разглашения. Например, Worldcoin орбы Альтмана работают именно так: ваши биометрически данные исполняются в нейронке, но ни она, ни владельцы сервиса не видят сырые данные

— Обработка приватных данных в облаке. Вы можете загрузить zk proof от текста / отчета / договора в облако, его обработает нейронка, но сам этот текст никогда физически не покинет пределы вашего компьютера
Вы обязаны это попробовать!

SDXL turbo умеет генерировать картинки уровня типичной модели SD/MJ, но делает это в один шаг, то есть меньше чем за секунду. Разрывает мозг.

Напомню, ровно 2 года назад вершиной диффузионок было сгенерировать размытую 64х64 пикселя фотку собаки. Сегодня вот это. Это как прогресс от телеграфа до айфона с 5G, но за пару лет.

То же самое нас ждет с другими модальностями, затем мультимодалками, затем агентами.

Бесплатно пробуем тут: https://clipdrop.co/stable-diffusion-turbo

Сама модель тут: https://huggingface.co/stabilityai/sdxl-turbo
This media is not supported in your browser
VIEW IN TELEGRAM
Запись с экрана в реальном времени
Если картинок в одну итерацию вам мало, то вот вам сервис для создания полноценных видео по промту. Сам себе режиссер 2.0. Ну, и целая планета режиссеров.

Очередное проявление post-scarcity. Но это не значит что конец экономики настанет мгновенно:

ИИ куда быстрее (по очевидным причинам) решил задачу создания топовой музыки, картин, рассказов, видео, мультфильмов лучше, чем задачи менеджмента, распределения ресурсов или уборки помещений.

Pika вышла вчера, генерировать можно бесплатно, но возможен вайтлист на регистрацию.
Взвешенный подход к e/acc

— прогресс это хорошо
— но централизация прогресса имеет последствия
— EA и e/acc одинаково вредны своей тягой к диктатуре
— мы можем создать децентрализованный, defense-first и «разумный» прогресс

Как? Виталик аки боженька молвил: https://x.com/vitalikbuterin/status/1729251834404249696
Если вы кодируете в Cursor, вы можете просто перетащить картинку в окно чата и попросить редактор написать код для визуальных элементов. Работает с HTML/CSS/React, Swift и наверняка другими языками, но я не тестил. Бесплатно, но нужен ваш личный ключик gpt-4.

Из всех языков программирования, самый universally hated one, CSS, наконец, повержен.

Если копирайтеры и юристы боятся, что их заменит ИИ, то программисты молят "Быстрее!"
Делать ставку на технологию — это значит всегда и везде быть последним. Если про конкретную технологию (BTC, LLM) говорят из телевизора и пишут на Техкранче — значит, вы уже опоздали. Инвестировать, изучать, строить бизнесы надо было чуть-чуть заранее. Потому что, разобравшись в ней, вы попадете в самое мясо отстающего большинства. Успешный бизнес начинается с инсайта — продуктового (понимание боли пользователя) или технического (ноу-хау, изобретение) — а не с легкости поднять денег.

Делать ставку на Технологию — это значит никогда не опоздать. Потому что Технология, то есть прогресс, за всю историю человечества были единственным реальным фактором любых изменений в цивилизации. Политика, границы империй, образ жизни и структура экономики в целом меняется в первую очередь из-за технологических изменений.
Рубрика «Что там с AGI?»

Во вчерашнем интервью, помимо посланного на три буквы Боба Айгера, Маск уверенно заявил, что «AGI грядёт через три года». По его словам, это машинка которая:

1. Пишет романы не хуже Роалинг
2. Открывает новые законы физики
3. Создает новые технологии

Джейсен Х. (СЕО NVIDIA) почти одновременно заявляет, что по его мнению AGI придет в течении 5 лет. И добавляет: obviously. Говорит, все наши чипы давно дизайнит ИИ. Но не очень понятно как это связано с AGI.

Парни заработали по сотне миллиардов каждый, поэтому, наверное, шарят. Хотя, как всегда с AGI, вопрос его определения. Должно ли там быть сознание? Желания? Воля? (Мой ответ — нет. Эти вещи возникают вследствие возможности и оттого страха смерти).

Но вот что любопытно:

Год назад массовый ИИ казался неизбежен, но скорее куда-то глубоко в бекэнд тех гигантов, типа внутри поиска гугла или анти-спама фб.

Но сегодня чат-боты на сайте бронирования билетов, в приложении для знакомств или умный помощник в PowerPoint могут решить тест на лицензию адвоката или практикующего врача.
This media is not supported in your browser
VIEW IN TELEGRAM
Если вы испытываете стресс относительно ускоряющегося и неостановимого развития ИИ и скорого приближения AGI, то вот милое видео, которое вас успокоит. Что может сделать бездушная машина человеку?

Ой, погодите…
2024/10/02 06:23:57
Back to Top
HTML Embed Code: