Telegram Web Link
Live stream scheduled for
Запилил Джуна-С-Глазами.

Я рисую на доске схему, дизайн или пишу текст от руки, а мой авто-джун может оцифровывать и превращать любые мои дикие идеи в код за пару секунд. Смотрите демо.

Вот что я уже попробовал:
- превратить мои каля-маля схемы в маркетинговый план
- написать код на основе картинки
- сделать питч на основе схемы продукта
- сделать описание / caption для любой фотографии в стиле инстаграма
- и другие кейсы, обсудим завтра на мастермаинде
Live stream started
Live stream finished (1 hour)
Когда-то в древности (начало 2023) за такое люди даже деньги платили. А некоторые стартапы даже рейзили деньги на такой продукт.

Эх, былые времена
Media is too big
VIEW IN TELEGRAM
Галочка, ты сейчас умрешь!

Чувак из твиттера сделал приложение, которое

1. Делает скриншоты игры, отправляет их в GPT Vision API

2. GPT пишет комментарии по игре

3. TTS озвучивает голосом

4. Голос накладывается обратно на видео

Получился ИИ-комментатор, который понимает что происходит в игре и комментирует в реальном времени.

Сегодня-завтра выложу видео в codex.town о том как это сделать за ~50 строчек кода.
Как ИИ влияет на общество и государство?

Темы подкаста:

- Влияние искусственного интеллекта (ИИ) на общество и его регулирование
- Проблемы дезинформации и манипуляции в обществе через ИИ
- Сложности регулирования ИИ и возможные пути его воплощения
- Практическое применение и риски ИИ, включая экзистенциальные угрозы
- Потенциальное использование ИИ в преступной деятельности
- Юридическая сингулярность: несоответствие скорости развития технологий и законодательства
- Проблемы демократии и регулирования в условиях быстрого развития технологий
- Роль искусственного интеллекта (ИИ) в принятии законодательных решений
- Риск использования ИИ в преступной деятельности и кибербезопасности
- Перспективы искусственного интеллекта в решении экономических проблем и влияние на рынок труда
- Влияние ИИ на творческие профессии и качество жизни
- Этические аспекты использования ИИ в юриспруденции и проблемы с доступом к справедливости
- Вопросы социальной справедливости и распределения ресурсов в свете развития ИИ
- Использование ИИ в правоохранительных органах и риски для свободы личности
- Заключительные мысли о возможности анархической организации в эпоху АИ и вызовы, стоящие перед обществом

Канал Александра Гамбаряна: https://www.tg-me.com/legalgamba

Смотреть: YouTube
Слушать: Google | Apple | Spotify
This media is not supported in your browser
VIEW IN TELEGRAM
Готовлю видео / вебинар на тему звуковых моделей (распознавание говорящих, разные языки, анализ музыки). Но нифига не успеваю, потому что каждый день выходит куча новых продуктов и появляется куча идей, которые надо попробовать (vision, агенты, тьюнинг). Ну и чувствую что уже не остаётся сил, потому что сейчас выходит ~8 часов записей и лайвов в неделю, плюс столько же подготовки. А ведь еще когда-то нужно работу работать успевать.

Но если не о личном, то музыкальная модель Меты научилась делать стерео музыку. И качество заметно выросло. Очень рекомендую вам поиграться с ней тут.

Кстати, это к вопросу о том какую модальность GPT добавит следующей.
Думаю над тем куда приложить усилия и внимание. Какие форматы вам больше всего нравятся (говоря об ИИ, технологиях, стратегии, бизнесе)?

Можно несколько ответов.
Anonymous Poll
49%
Посты в телеграме (несколько раз в день)
35%
Еженедельный дайджест и комментарии
34%
Лекции/вебинары
18%
Подкасты
41%
Смотреть записи на ютубе
33%
Читать лонгриды
This media is not supported in your browser
VIEW IN TELEGRAM
Со всеми этими релизами забыл поделиться еще одной демкой: я сделал бота, который заменяет меня. А именно — ведёт вебинары и читает лекции про генеративный ИИ. То есть, бот сам пишет для себя сценарий на основе того что видит, сам его читает.

Как это работает?
- я снял видео с экрана просто кликая каждый слайд
- gpt-v распознал слайды и что на них написано
- gpt-4 написал комментарии к ним
- gpt-4 отредактировал, добавил эмоций и синхронизировал тайминг. перевел на русский
- gpt-tts озвучил (с сильным американским акцентом, но на итальянском, испанском, французском работает прям идеально)
- сохранил и соединил видео и аудио

Все это ультра-просто. Занимает ~50 строчек кода. На гитхабе есть куча примеров как именно это сделать.

P.S. Вангую, что через год количество AI-generated видео (в том числе длинной формы) на ютубе превысит количество сделанных людьми.
Тут биткоин еще вырос в два раза с прошлого года…

Я заметил что рыночные тренды в крипте связаны с трендами регуляции:

Первый тренд — государственная регуляция, для кого крипта является злейшим врагом. То Китай запретит, то введут повальное KYC, то отклонят ETF, то примут запретительные законы. Государство выигрывает очередную битву, но не войну.

Второй тренд — саморегуляция. То слишком много ICO и мемкоин пирамид, фармилок, то бессмысленных NFT коллекций. Все это лопается, рынок впадает в апатию. Начинается самолечение.

Но кроме этих двух трендов, которые давят на цену вниз, есть еще восходящий тренд реального развития технологии и социальной адаптации. Все больше людей узнает, видит практическую пользу и начинает пользоваться криптой. Крипта, будучи одновременно экономическим и культурным феноменом, идет в контратаку.

Вот эта вечная битва, как день с ночью, и приводит к такой размашистой синусоиде.

Сатоши, конечно, мастер психоистории, ибо увидел эти тренды на десятилетия вперед, да еще и синхронизировал их с политическими циклами в США и заложил в механику халвинга.
Вы наблюдаете смерть этого телеграм-канала, в прямом эфире.

Я вижу очень маленькую вероятность того, что через 12-18 месяцев я, а также большинство авторов телеграм-каналов, рассылок, блогов, онлайн-курсов будут продолжать это делать так же, как они делают это сегодня.

Создание контента, особенно нон-фикшн-контента, посвященного бизнесу, технологиям, психологии, саморазвитию, здоровью, истории, новостям, да и чему угодно другому, является вполне себе алгоритмизируемым процессом. Сегодня этот процесс хранится в весах нейронной сети у меня в голове. Но ничего не мешает переложить это на нейронную сеть цифровую.

Поиск актуальных трендов, анализ того, что лучше работает в плане конверсии, стилистическое оформление, юмор, создание завлекающих картинок и видео, а также repurposing контента, это уже сегодня автоматизируемые вещи, а через год это будут тривиально автоматизируемые вещи.

Написать несколько тезисов, закинуть несколько источников самых популярных авторов по теме, примеры стиля — этого будет достаточно для создания ничуть не менее качественных постов или статей, чем вы читаете сегодня. Взять статью и сделать из нее рилс для тиктока. Взять рилс и на его основе сделать твит. Взять текст и превратить его в подкаст. Взять подкаст и превратить его в видео. Взять записанное кем-то уже видео и превратить это в статью и разместить у себя. Идейка для стартапа, кстати.

Знаете, я вчера смотрел на ютубе видео где чувак на Урале 40 минут чистит трактором снег. Лет 10 назад я бы подумал что он занимается бесполезной работой, мог бы пойти в офис на х10 зарплату. А теперь я знаю: бесполезной работой занимаемся мы.

То что мы делаем уже мертво. Just not evenly distributed.
Сделал GPT-игру "Crypto Maze"

Вы оказались в мрачном лабиринте из комнат, содеражащие странные но чем-то привлекательные объекты. Вы видите записку, в которой говорится что в одной из комнат спрятан ключ от Ethereum кошелька. Вы отправляетесь на поиски свободы и, если повезет, невероятного богатства.

Как это работает:
— GPT генерирует план лабиринта
— файл загружается в долговременную память бота
— DALL-E в реальном времени рисует графику
— пользователи бродят по лабиринту
— первый кто нашел ключ получает выигрыш на свой Eth адрес (через API)

Играть тут (первое сообщение определяет язык игры): https://chat.openai.com/g/g-vyAjr5W62-crypto-maze
Угар с OpenAI DevDay.

Ребята натюнили модель на своём слаке, и она на сообщение "напиши пост про промтинг" теперь отвечает "займусь этим первым делом, но завтра с утра"
Media is too big
VIEW IN TELEGRAM
Чувак на хакатоне запилил персонального жизненного коуча используя новые фичи GPT.

— нательная камера снимает весь ваш день
— GPT Vision разбирает что вы делаете в течении дня
— GPT-4 соотносит это с вашими целями и готовит отчет
— TTS + DALLE готовит в конце дня ролик, в котором рассказывает голосом что у вас получилось хорошо, а что плохо (например, гуляли ли вы на улице, вставали ли вы из-за компьютера и сколько раз отвлекались на соцсети)

Not bad, для однодневного проектика.
Media is too big
VIEW IN TELEGRAM
Кожаная профессура поёжилась..

А вот еще один проект с хакатона, в котором показан GPT-тьютор по орбитальной мехнике, который умеет вести студента по теме, вести сократический диалог, распознавать формулы и графики на бумаге или доске, проверять их и, конечно, общаться голосом.
Дабы поставить финальную и жирную точку в споре об авторском праве и ИИ:

В диффузионных моделях и в LLM нигде ни в каком виде не хранится оригинальный текст и картинки, на которых они были обучены. В некоторых случаях модели могут воспроизвести стиль или текст близко к оригиналу. Но это будет создание объекта авторского права с нуля, не копия.

Поэтому рассуждения про то что нейронные сети ущемляют профессиональных двачеров и 4чанеров, воруя их контент юридически идентичны заявлениям, что Моцарт украл музыку сумев её запомнить, Вырыпаев в своей пьесе скопипастил Библию, а Пелевин украл идеи у Нагарджуны. Или, еще ближе, если Дэвид Дойч подаст на меня в суд за то что я на подкасте рассказал о чем его книга.

Генеративные нейронные сети нигде не хранят оригинальные материалы из своего сета для тренировки, но невероятная их способность имея размер в тысячную процента от объёма данных для обучения все-таки воспроизводить что-то близкое по смыслу — это фантастическая загадка Вселенной о топологии латентного пространства и компрессии знания. Пока что не решенная никем, кстати.
​Хочу посоветовать вам один толковый канал, автор которого реально занимается AI и опубликовал 15+ статей на топовых конфах.
Артем — Senior Research Scientist в элитной лабе по генеративному AI, Meta GenAI в Цюрихе и ещё находит время вести канал!

Например, недавно он писал о новой text-2-image модели Emu, к которой приложил свою руку и ускорил генерацию до 5 секунд. Или вот пост про модель для генерации стикеров, котороую Артем лично оптимизировал. Моделька уже крутится в Инсте и Whatsup в проде.

Артем в целом пишет о нейронках, AR/VR и генеративном AI, добавляя свое критическое мнение, а также травит байки о работе AI ресерчера в Meta.

Мало у кого из авторов каналов есть такой мощный полевой опыт в AI как у Артема, так что его канал точно стоит почитать: @ai_newz
2024/10/05 11:15:44
Back to Top
HTML Embed Code: