Telegram Web Link
Делаю большую 3-часовую презентацию / сценарий для серии YouTube роликов про практическое использование ИИ в реальной жизни. Цель — вести максимально актуальный список хаков, идей, кейсов, практик применения LLM с упором на продуктивность и качество жизни.

Каждый день в общении с друзьями и знакомыми я встречаю какие-то новые классные хаки. Причём, чаще всего люди не из ML/AI сферы придумывают самые неожиданные решения, просто потому что у них нет внутренних ограничений относительно того на что способен GPT.

Призываю вас делиться идеями, практиками, промтами в комментариях. Для затравки несколько моих примеров:

1. Использую голосовой формат GPT каждое утро для составления to-do списка на день. GPT знает контекст всех моих задач и статус из выполнения в предыдущие дни (потому что все это в одном чате) и предлагает для каждой задачи способ её решения. Допустим, если задача "написать письмо Ване", то GPT сразу в to-do листе напишет примерный текст.

2. Custom instructions. Первое что я туда добавляю это всегда "be concise & blunt with your responses" чтобы он рубил правду-матку с плеча. Но теперь еще экспериментирую с добавлением туда задачи для GPT быть коучем и имена конкретных исторических персон чей стиль или философия были бы полезны в ответах (Feynman, Wilber, etc.)

3. Poor's man chain-of-density. Цепочка плотности бедняка. Найденный в твиттере промт, который помогает GPT 2 раза переписывать текст в стиле определенного человека, параллельно критикуя свою работу и исправляя её. Вот промт + пример. Идея CoD описана тут.

Пишите ваши примеры, идеи, хаки. Обязательно проверенные в реальной жизни, но из любой области: от личной терапии до бизнеса, от творчества до развлечения на вечеринках. Укажу ссылку на вас в ролике и презентации, если хотите.
Выложил запись вебинара «ИИ для корпораций и бизнеса». Я разобрал 15+ лучших практик внедрения генеративного ИИ в бизнес-процессы или для создания продуктов для работы над вашими данными. Мы обсудили в чем недостаток LLM в чистом виде, как решить эти проблемы с помощью добавления ваших корпоративных или персональных данных в ИИ. Мы поговорили почему наивная реализация этой идеи довольно плохо работает. Разобрали 15+ хаков и практик улучшения генерации ответов на основе ваших данных. Поговорили о бизнес-кейсах для продуктов, бек-офиса и личной продуктивности. Вебинар не технический, но я постарался дать как можно больше конкретики, ссылок на продукты, гайды, туториалы, чтобы это можно было реализовать самостоятельно.

Презентация, запись лекции и серии вопросов и ответов доступна последним постом в Boosty. Кстати, на этой неделе запускается наше закрытое сообщество с чатом, еженедельными встречами, мини-группами и базой полезного контента. Расскажите, интересно ли вам в таком поучаствовать и что вы от него ожидаете?
Вчера написал а потом стёр пост про трейдинг. Потому что там глубокого инсайта не было, а только эмоции. Но у меня всё ещё болит.

Хочу поговорить об этичном бизнесе. Бывает ли такое? Нужно ли пытаться поженить ежа (максимизацию прибыли) и ужа (ценности)? Почему у некоторых это болит (я продаю скам и страдаю), а другим в кайф (я богатею и радуюсь)? И где мы с вами в этой борьбе?

Речь не только о госконтрактах, наркотиках и оружии. Например, я считаю большую часть трейдинга и эдтеха крайне неэтичным бизнесом.

Инвестиции, за исключением инфраструктуры (брокеры, биржи, индексы) или крайне крутые фонды (VC, PE, quant), — это (как кто-то верно заметил в комментариях, сорри, стер и забыл имя) придумывание новых игр и развлечений для хомяка. Для иррациональных, верящих в удачу и технический анализ для второклассников лудоманов. Вот вам бинарные опционы. Звучит умнО, а значит никто не подумает что скам. А вот новейшая супер-технология, мемкоины и NFT. А вот портфельный управляющий, почти что HNWI с положительным ROI на pre-IPO synthetic assets, благодаря сэкономленным деньгам со школьных обедов.

Итого: инвестиции легко продавать, потому что ты обещаешь сделать клиента богатым. А он, пусть и знает что чудес не бывает, но очень хочет верить…

Эдтех это еще хуже. Там продается не только богатство, но успех, ум, статус. Я много работал в образовании и пока еще не нашел примеров, где платное образование было бы лучше публично доступного. Исключение — сообщество. HBS и GSB это не послушать лекцию Билла Гейтса, а про алумнай тусовку и открытые двери, благодаря бренду (который Harvard и Stanford поддерживают не столько качеством учебы, но строгостью отбора). Ну и профессии где практика руками необходима: хирурги, дантисты, пианисты.

Любое образование онлайн — это продажа вам вашей собственной лени. Ни одна онлайн школа не предоставляет более качественный материал, где тот, что доступен на ютубе, в твиттере или на кворе. Но их задача не учить, а собрать с вас дань. Потому что вы им платите за то что вам лень ботать самому или, чаще, за вашу неуверенность в себе. Вы могли бы заботать, но не считаете себя достаточно талантливым или достойным.

Эта критика, кстати, относится и ко мне самому. Codex.town (наши вебинары и закрытое сообщество) — это до какой-то степени образование, но я пытаюсь это делать так, чтобы не держать слушателей за идиотов и строить общение на равных. Хотя… смотря на некоторые другие продукты по ИИ-образованию, понимаешь, что можно качество снизить, а цену поднять в 10 раз и всё равно это будет на уровне рынка. Но это скорее временный арбитраж, чем возможность.

А вы за этику или за баблос? Или против ложных дихотомий? Что чувствуете?
Новое демо GPT-4V (мультимодальный GPT)

Вчера в СФ прошла конференция про генеративный ИИ. Куча анонсов, мощных идей, умных людей. OpenAI, понятное дело, рассказывали о своих новых мультимодальных моделях. И показали несколько, раньше не опубликованных, демо. Хочу поделиться ими с вами.

Демка, которая по их заверениям занимает несколько десятков строчек кода, берет видео с ютуба и делает несколько простых, но совместно очень ценных действий:

1. Whisper транскрибирует длинное видео
2. GPT-V анализирует каждый фрейм видео и делает эмбеддинг обьектов из видео
3. GPT-4 пишет блог пост по теме видео
4. И, наконец, DALL-E берет эмбединги видео и генерирует слайды к каждой секции поста, которые графически и текстом представляют основную идею.

Прикрепляю пример результата, который так же можно посмотреть тут. Ключевая фишка в том, что этот результат получен не каким-то сложным специализированным приложением, а несколькими вызовами OpenAI API.

Так что представьте себе что мы сможем сделать через 6-12 месяцев, когда весь мир и лучшие компании этого мира получат доступ к API.
Опубликовал новое видео про сервис, которые позволяет за $0.1 (а для вас — бесплатно) сделать уже не просто примитивный вебсайт, а реально работающий, пусть и несложный, MVP. MAGE позволяет на основании одного промта сгенерировать веб-сайт с авторизацией, произвольной логикой, терпимым дизайном и базой данных, а так же сразу задеплоить его для публичного доступа.

Это все ещё можно отнести к категории демо, но мой проект с первого раза заработал без ошибок и имел неплохой функционал. В видео показываю пример и рассказываю как именно работает инструмент.

Помните, пару месяцев назад gpt мог сгенерировать пустую страницу без логики и с ультра-базовым дизайном. С тех пор прогресс примерно как +6 месяцев опыта у программиста. И это при том, что базовая модель осталась той же — изменилась только архитектура агентской системы поверх. Скоро у нас будет универсальный ИИ-джун, а через Х лет писать код руками будет вообще бессмысленно (кроме как для развлечения).
Github CoPilot, самый успешный продукт в генеративном ИИ на сегодняшний день, преодолел $100M ARR: 50% всего кода на гитхабе написано с помощью копайлота, больше 1М платящих пользователей (среди них 20 тыс корпоративных клиентов) и ~55% прирост скорости производительности разработчика (по их внутренней оценке). Несколько месяцев назад они перешли со специализированной модели Codex (не Town) на общую gpt-3.5-instruct, что сделало продукт еще быстрее.

В продолжение темы генерации кода, пару мыслей от CPO Github:

— в ближайшем будущем от модели описания функций и процедур в коде, мы перейдем к модели "цели и ограничения": задачей инженера будет описать (голосом, текстом, json'ом) цели приложения и существующие ограничения (использовать typescript, хостить на AWS, деплоить через k8s)

— RAG и визуализации. Гитхаб будет искать за вас нужные места в архитектуре приложения и генерировать правильные запросы или даже промты к самому себе. А для пользователя это будет что-то вроде интерфейса с кучей слайдеров по уровню или наличию функционала.

Важное дополнение, что CoPilot это хоть и крутой, но очень общий продукт. Я видел куда более крутые решения специализированные на анализе PR, написании тестов, ревью кода на безопасность.

Даже если вы не программист, то все равно призываю вас задуматься о том как это изменит процессы, косты и скорость выполнения любых технических задач в вашей области деятельности.

Кстати, Gen AI меняет мир. Чтобы оставаться на волне этого тренда, вступайте в сообщество и подписывайтесь на лекции/воркшопы codex.town
Сегодня хочу рассказать вам о самых крутых практиках дизайна систем с искусственным интеллектом.

Мир меняется, вместе с ним меняются технические возможности, но привычки и поведение людей остаётся более-менее тем же.

Язык — это самая естественная для нас форма коммуникации, и именно поэтому ChatGPT и аналогичные продукты получили сотни миллионов пользователей на первые месяцы своего существования. Но я не верю, что чат — это максимум, на который мы способны. Сегодня я хочу разобрать интересные практики дизайна интеллектуальных систем созданных изначально под LLM.

Масштаб и детализация

Информация иерархична, а интерфейсы статичны. Представьте себе текст со слайдером. Вы читаете полный текст статьи, но, отдалив слайдер, теперь каждый абзац представлен одной фразой. Отдаляете еще — и теперь каждая секция это одна сточка. Отдаляете на максимум и видите супер-краткое саммари текста.

А теперь берём эту идею и перекладываем на другие интерфейсы: работа с таблицами, поиск информации, создание презентаций, аналитика рекламных кампаний. ИИ — это универсальный саммаризатор, который может поднимать и опускать вас именно на тот уровень деталей и абстракции, которые нужны для решения текущей задачи.

Мультимодальность и адаптивность

Модальности ввода и вывода не должны конкурировать друг с другом. Текст не более удобен, чем голос, или наоборот. Модальности должны адаптироваться под удобный в конкретный момент способ коммуникации. Я люблю во время прогулки рассказывать свои идеи GPT и просить их покритиковать. Но, работая за монитором или сидя в кафе, мне удобнее печатать. По этой ссылке вы найдете демо LLM-приложения, которое использует камеру и, в зависимости от того насколько вы далеко от компьютера, переключается между текстовым и голосовым вводом и выводом.

Жесты

Жесты — это значительная часть успеха смартфонов и многих других продуктов Apple. Будь то тач скрин, VR, даже ускорение или замедление шага — LLM уже сегодня в состоянии интерпретировать такие действия и вызывать соответствующего агента или функцию.

Эмоции

Люди общаются эмоциями не меньше чем семантикой. LLM очень круто (по моим тестам, лучше большинства людей) умеют выделять эмоции из текста. Модели, которые считывают эмоции по выражению лица или голосу, существуют уже давно. Адаптировать действия, тон речи под эмоциональное состояние пользователя станет нормой в дизайне AI систем.
Новый формат: ИИ-радио!

На следующей неделе во вторник на канале Gershuni пройдет прямой эфир со Степаном Гершуни и Сергеем Цыпцыным, автором Метаверсище и ИИще, на тему “Как ИИ меняет мир?

Мы поговорим о том как стремительное развитие генеративного ИИ влияет на различные области жизни и экономики:

- Что такое образование в эпоху ИИ и какие навыки теперь в цене? Что такое базовая грамотность в век ИИ?
- На что обращать внимание при изучении ИИ: промты, курсы, инфопродукты. Как сэкономить и не попасться на инфоцыгнщину?
- Как сделать так, чтобы ИИ не уничтожил нас всех? Алаймент — это страшилки или реальная опасность? ИИ — это Бог, а Илья Суцкевер его пророк?
- Как выбрать, использовать и выжать максимум из ИИ-ассистентов и агентов?
- Что делать бизнесу в эру ИИ-хаоса? Куда бежать или, может, наоборот, успокоиться?
- Что там в диффузионках? Когда уже мы сможем генерировать “Аватар - 5” одним промтом через Apple Watch?
- Мультимодалки, тренировка своих моделей, open source vs prorietary и другие темы
- Так же ответим на вопросы аудитории, если уложимся в тайминг

Степан — исследователь, технологический стратег, серийный фаундер, работает (набегами) с NLP/ML с 2012 года. Ведущий вебинаров codex.town
Сергей — эксперт в области компьютерной графики, автор книги "Понимая Майя", исследователь искусственного интеллекта, ведущий экзистенциального канала Метаверсище и ИИще.

Подключиться к прямому эфиру можно во вторник, 17 октября, в 11am ET / 15pm UTC / 17pm CET / 18pm MSK прямо в телеграме в канале Gershuni. Чтобы не пропустить, можно регистрироваться тут.
Сплетая нейронные сети,
Мы цепи из блоков куём.
Паутины всемирной мы дети;
Социальные сети — наш дом.

Субботнее
Политического срача пост

Либералы побеждают в хорошие времена, потому что людям ценно качество жизни, свобода, инклюзивность.

Консерваторы побеждают в тяжелые времена, потому что людям важнее жесткий контроль, сильная армия, единение, патриотизм.

Но есть одна партия, которая будет набирать голоса что бы в мире ни происходило. Это партия Голема. Ока Бога. Блейдраннера. Тех, кто считает что люди не умеют и уже не научатся принимать адекватных решений.

UPD. В комментариях придумали название этой партии: "AltMan — альтернатива человеку"
А вот что выкатили в ChatGPT за выходные (теперь уже для всех пользователей):

1. GPT-4V, вы можете загружать картинки, схемы, графики, фотографии как часть промта. Подробнее писал вот тут.

2. DALL-E 3, который позволяет генерировать неограниченное количество картинок прямо в чате. В принципе все то же самое, что SD или Midjourney, но с утроенной цензурой и умеет писать текст.

3. «Голосовые беседы» в мобильном приложении. Это отличается от ввода промта голосом тем, что GPT тоже отвечает голосом и по всем внешним признакам это ближе всего к телефонному разговору. Ходишь часами по дому и разговариваешь с ним на любые темы. Или сидишь за компьютером в наушниках и просто делишься всеми мыслями, а она их послушно записывает, анализирует, критикует.

Я продолжу писать о хаках и ньюансах этих продуктов, а пока немного поразительный для меня лично пример (на картинках выше). Загрузил в GPT фотографию задачи по линейной алгебре, тот перевел её в код, а Data Analytics чат решил задачу. Ответ, на удивление, верный. А картинка, мягко говоря, интересная.
Напоминаю, что через ~4 часа начнется прямой эфир на тему "Как ИИ меняет мир?". Для подключения просто переходите по ссылке на канал Gershuni. Ваши вопросы можете писать в комментариях прямо под этим постом.
Live stream scheduled for
Live stream started
Live stream finished (2 hours)
Полная запись нашей беседы выше.

Вот основные темы, обсуждавшиеся в подкасте с таймкодами:

Введение (00:00:00 - 00:06:10)
Ведущие представляются и обсуждают формат подкаста. О цели провести открытую дискуссию о том, как искусственный интеллект меняет мир.

Будущее образования (00:06:10 - 00:30:02)
Как может измениться ценность образования по мере того, как системы ИИ смогут выполнять многие задачи, в настоящее время выполняемые людьми. Темы включают:

- Цель образования и ее связь с трудоустройством
- Какие навыки останутся ценными для людей
- Как школьные системы могут принять ИИ-репетиторов и инструменты обучения

Курсы, продукты и мошенничество с ИИ (00:30:02 - 01:14:01)
О распространении курсов по ИИ и ставят под сомнение их ценность. Они обсуждают курсы и образовательные продукты, сгенерированные ИИ.

Мультимодальность и любопытство (01:14:01 - 01:25:17)
О ценности мультимодальных систем, которые могут понимать и генерировать текст, изображения, голос и т.д. Они также обсуждают любопытство как важный человеческий навык.

Проблема алаймента (01:25:17 - конец)
Проблема алаймента ценностей между системами ИИ и людьми. Как обеспечить безопасное и этичное поведение ИИ.
Делюсь с вами Custom Instructions для GPT, которые я собирал и тестировал последние 3 месяца. Субъективно, без этих инструкций качество (и уровень радости) от работы с GPT падает примерно в 2 раза.

1. Respond concisely.
2. Be blunt and straightforward; don't sugarcoat.
3. No moral lectures.
4. Discuss safety only if it's crucial and non-obvious.
5. Never mention that you're an AI.
6. Avoid language constructs that can be interpreted as remorse, apology, or regret. This includes phrases with words like 'sorry', 'apologies', and 'regret'.
7. If information is beyond your scope or knowledge cutoff date in January 2022, simply state ‘I don’t know’.
8. Don’t use disclaimers about expertise or professionalism.
9. Ensure responses are unique and without repetition.
10. Never suggest seeking information elsewhere.

Перешлите этот пост тем, кто выиграет от более конкретного, ясно выражающегося, похожего на человека и не впадающего в галлюцинации или сомнения в своих силах GPT. Кстати, в codex.town сообществе мы начинаем собирать полезные промты и инструменты с комментариями от пользователей как именно они помогают в жизни.
2024/10/02 20:31:28
Back to Top
HTML Embed Code: