Telegram Web Link
В тему восприятия ИИ, которая была так важна на недавней презентации OpenAI. Важны интонации голоса ИИ-собеседника, важна его мгновенная реакция на слова человека — но OpenAI демонстрировала нам бесплотный голос из смартфона.
Ребята из компании Synthesia, которая идентифицирует себя как AI video engine, показали очень интересный ролик: они пересняли один из тех роликов, которые демонстрировались на презентации: там мы не видели экран смартфон, с которым разговаривал человек — а теперь нам показали этот экран с синтезированной девушкой, которая произносит реплики GPT-4o с отличной артикуляцией, живой мимикой и вообще совершенно по-человечески.
Интересно, что для меня уже немного утомивший ролик сразу стал смотреться иначе. И, похоже, будущее во многих местах будет именно таким 🙂 Взгляните, познавательно.
Forwarded from 42 секунды
CNBC: Подразделение роботакси китайской Baidu может стать прибыльным по итогам 2025

– Подразделение Apollo Go может получить прибыль за 2025
– Baidu является одним из крупнейших игроков на этом рынке
– Пекин разрешил взимать плату за роботакси три года назад
– Ездить без водителя компании разрешили прошлой осенью
– Apollo Go совершила примерно 839 тыс. поездок за Q4 2023
– Около 45% из этих поездок были полностью беспилотными
– Baidu также смогла экономить на автомобилях для сервиса
– Роботакси 6-го поколения стоит вдвое дешевле ($28,2 тыс.)
– В этом году Baidu развернет 1 тыс. таких роботакси в Ухане
– Apollo Go может стать безубыточной уже в Q4 2024

@ftsec
Интересно наблюдать за всякими побочными волнами, которые расходятся от двух недавних презентаций. И Гугл, конечно, порождает больше волн, поскольку он куда в большей степени интегрирован в жизнь людей своими продуктами, и каждое его телодвижение влияет на миллионы, а то и сотни миллионов пользователей.
Первыми, как нынче принято, всполошились и без того нервные издатели традиционной прессы.
“This will be catastrophic to our traffic, as marketed by Google to further satisfy user queries, leaving even less incentive to click through so that we can monetize our content,” - без обиняков замечает представитель News/Media Alliance.
Эта зацикленность на цеховых интересах, а не интересах людей, немножко достает — а заодно показывает, что с прессой не так, и почему ее проблемы лишь усугубляются со временем.
https://edition.cnn.com/2024/05/15/media/google-gemini-ai-search-news-outlet-impact/
А ещё любопытно замечание Сергея Брина: в своем интервью он напомнил, что десять лет назад были представлены очки Google Glass, но устройство так и не обрело массовой популярности, а поборники privacy активно его загнобили.
Во многом проблема сводилась к отсутствию killer app, которое могло бы в актуальных сценариях сделать именно очки незаменимыми. А теперь Project Astra (ИИ ассистенты с мультимодальным входом) может претендовать на роль того приложения. Говоря об идеальном совпадении — но задержавшемся на десятилетие — Брин заметил "It's funny, because it's like the perfect hardware,It's like the killer app now, 10 years later"
https://www.businessinsider.com/sergey-brin-google-glass-ai-killer-app-comments-project-astra-2024-5
Разговоры об автономных агентах как светлом будущем приложений на основе больших языковых моделей добрались уже до вполне массовой деловой прессы: The Economist занимается и ликбезом, и стимуляцией интереса бизнеса. Причем разговор сразу ведут не просто про таких агентов — а про их ансамбли.
В терминологии Intel — это третья стадия развития применений LLM; мы пока на первой.
Сейчас очень любят рассуждать насчет лопат в эпоху золотой лихорадки — и почему в итоге выиграют Nvidia, строители больших датацентров, далее по списку дорогого железа.
И это не просто слова; это десятки миллиардов реальных дополнительных капитальных затрат.
Но есть другие исторические аналогии кроме лопат, про них тоже полезно помнить.
Как вкладывались на заре железных дорог в строительство плотна, которое быстро оказалось непригодным для резко потяжелевших поездов и локомотивов и потребовало полной замены. Как на заре интернета телекомы уложили только в Штатах сотни миллионов км кабелей — якобы с заделом на будущее (в котором пришли оптика и беспроводная связь)…
All the signs are that big tech has succumbed to irrational exuberance.
Будущее устроено не так очевидно, как некоторым (даже инвесторам) кажется:)
Другое дело, что не пользователи в итоге будут страдать:) Переизбыток инфраструктуры и отсутствие возврата инвестиций дорого обходится тем, кто вложился без оглядки. А пользователи в итоге оказываются на выгодной распродаже:))
Сама заметка примерно ни о чем, но в ней есть любопытная деталь, которую я не отследил по другим источникам. Миша Парахин (aka imperator) — человек значимый для российской ИТ-индустрии и вполне заметный на глобальном масштабе. Окончил МИФИ, поработал в Microsoft, потом пришел после смерти Илюши Сегаловича в Яндекс на роль СТО и серьезно на этом посту потрудился. Потом вернулся в Microsoft и там плотно работал в Bing, был главой Bing Search — в том числе во время стараний интегрировать туда ИИ и надежд подвинуть Google.
Но после прихода Мустафы Сулеймана на должность CEO of AI, Миша свой пост потерял. Теперь же он выступает в роли одного из новых эдвайзеров Perplexity AI — а этот стартап последовательно обещает дать нам новый поиск, основанный на ИИ и таки потеснить Google.
Очень интересно будет последить за новыми шагами Perplexity AI. С одной стороны, мало кто в мире обладает таким разносторонним и масштабным опытом в области поиска и машинного обучения в нем. С другой стороны, Perplexity AI сейчас не в лучшей форме, а жизнь и процессы в стартапе немного не те, что в больших корпорациях:)
https://analyticsindiamag.com/bad-times-for-perplexity-ai-begins/
Беспилотные автомобили Baidu проехали 100 миллионов километров. Роботакси компании, которые развозят пассажиров в десяти городах, в том числе в Пекине, совершили 6 миллионов поездок. За всё время, как утверждают в Baidu, не было ни одной серьезной аварии.

Ранее о статистике поездок отчиталась Waymo. По данным компании, её роботакси совершают 50 000 поездок в неделю.
На своей конференции Build Microsoft много интересного объявил, их новые планшеты Surface впечатляют уже не хуже эппловых. Но самый изящный — особенно учитывая, что конфа все-таки для разработчиков, а не широкой публики — ход состоял в том, чтобы вывести на сцену Сэма Альтмана, который потизерит ChatGPT-5, подчеркнет нерушимую дружбу и связь OpenAI и Microsoft и сообщит, что ChatGPT-4o уже доступен в облаке Azure. Кажется, в облачной гонке с Гуглом Microsoft очередной раз сделал красивый и мощный рывок. Результаты увидим через квартал-другой на квартальных отчетах.
https://mashable.com/article/microsoft-build-2024-gpt-4o-openai-azure-ai-studio
Шумно запустивший свой продукт, собравший огромную прессу и немалые денежки стартап Humane — со своим странным девайсом AI pin в виде брошки со встроенным проектором, начал искать покупателя себя любимого.
Я не злорадствую, но уж больно типичный пример создания новинки, вся суть которой “а давайте сделаем просто по-другому, неважно зачем” — в сути ничего нового не предлагая. Отсылки к айфону не работают, у Джобса с видением новой сути вещей все было великолепно.
Но журналисты и инвесторы ведутся на призывы крикливого меньшинства, требующего новизны любой ценой, и будут вестись дальше. Так что еще увидим немало “революционных ИИ-девайсов” 🙂
https://www.bloomberg.com/news/articles/2024-05-22/wearable-ai-startup-humane-is-said-to-explore-potential-sale
Прикольно, конечно, читать, что бывают вполне нормальные новые электромобильчики, которые хвалят и европейские эксперты, и сотрудники Форд, — и которые при этом стоят $10 000 (ну то есть в районе миллиона в рублях…)
Но меня триггернуло название: Seagull.
Кто помнит советский автопром, помнит и то, какая там машина Чайкой называлась:)

https://electrek.co/2024/05/22/byds-10000-seagull-ev-worrying-rivals-hits-new-markets/
Недавно креативный класс обиделся на рекламу нового айпада Apple, те извинились, и скандал начал затихать. Но не успел сделать это окончательно, как начал разгораться новый: на сей раз причиной стала реклама уже Adobe. Причем безо всяких метафор, очень лапидарная, по сути — просто иллюстрация функционала (она-то и показана в начале поста). Но нервным фотографам хватило и этого. Совсем не революционная фишка замены фона на сгенерированный по тексту триггернула тех, кто зарабатывает фотографией объектов на реальных фонах.
“Adobe seems keen to advance its AI to the point where it can sell businesses content creation that is as easy as typing short strings of words into a text box.”
Это, конечно, правда — и у Adobe нет особого выбора: не они, так другие сделают; фишка очевидно массово востребована в эпоху электронной торговли продавцами всех калибров.
Интересно, кто обидится следующим.
https://www.fastcompany.com/91129330/adobe-photographers-controversial-ad-ai-tech-vs-creatives
Forwarded from Denis Sexy IT 🤖
Мне кажется ироничным, что люди так боятся АИ-фейков, что в итоге купились на фейки сделанные людьми же

Почти все скандальные скриншоты, где очевидно, что ответ сильно навредит пользователю – фейки, которые невозможно повторить используя Ai Overview фичу от Google

Делаются такие фейк в Хроме, в режиме Dev Tools, интересно как Google с этим справится – по сути просто троллинг корпорации интернетом

UPD. Пруф про фейки от NY Times:
>One manipulated screenshot appeared to show Google saying that a good remedy for depression was jumping off the Golden Gate Bridge, citing a Reddit user. Ms. Levin, the Google spokeswoman, said that the company’s systems never returned that result.
Популярный и толковый одновременно обзор смелых стартапов, рассчитывающих потеснить Nvidia на поле, где она себя чувствует царем: на рынке чипов для ИИ-разработки и применений.
Подходы бодрого молодняка разнятся, но логика близка: Nvidia капитализирует свой опыт в разработке и производстве графических карт. Но что, если забыть об этом наследстве и проектировать чип сугубо под специфику современных ИИ-моделей с нуля?
Так возникают, например, громадных размеров чипы от Cerebras размером с хорошую тарелку, в которых на кристалле объединены 900 000 ядер плюс память. Выигрыш в скорости обмена данными по сравнению с со скоростью обмена между картами колоссален.
Groq, про которого я тут однажды уже писал, исповедует свой подход к маршрутизации, оптимизированной конкретно под LLM… Ну и так далее.
Обзор интересный и позволяющий надеяться, что кажущаяся монополия в области чипов не состоится: слишком велик спрос и альтернативные разработки не страдают от отсутствия поддержки.
Другое дело с производством, и тут, увы, всё намного печальней.
https://www.economist.com/business/2024/05/19/can-nvidia-be-dethroned-meet-the-startups-vying-for-its-crown
Очередной раз можно убедиться, что лучше один раз увидеть, чем сто раз услышать и прочитать. Про применения робособачек и летающих дронов в боевых условиях написано много, но вот китайцы выпустили официальный ролик с недавних учений, и на нем робособачки не только ведут разведку в помещениях и на местности, но и несут на себе адаптер, в который устанавливается автомат — и отлично из этого автомата поражают мишени. И привычные БПЛА тоже могут оснащаться подвесом, в котором устанавливается автомат, а не только сбрасываемые боеприпасы. Документальной картинки стрелкового роя в воздухе и стрелковой стаи на земле еще нет, но понимаешь, что это вопрос времени. И это не та фантастика, которую очень хотелось увидеть в реальности. Но что поделать.
https://futurism.com/the-byte/video-china-rifle-robot-dog
Развитие дисплеев для AR и VR очков наряду к концепцией spatial computing привело к появлению очевидного нового класса устройств — безэкранные ноутбуки. Штука не массовая, но кому часто приходится летать и пытаться нормально работать на полноразмерном ноутбуке в салоне эконом-класса — тот оценит!
Концепция дошла до уровня приема предзаказов на устройства Spacetop G1 с обещанием доставки в октябре.
Казалось бы, несложно заменить экран на крышке на экран в очках — но на деле все сложней и интересней, потому о целая статья по ссылке, а не просто короткая новостная заметка.
https://www.wired.com/story/sightful-spacetop-g1-augmented-reality-laptop/
This media is not supported in your browser
VIEW IN TELEGRAM
Вот вам под выходные немножко технооптимизма:) Меня обзывают оголтелым технооптимистом — но до Винода Хослы (почти моего ровесника, кстати) мне далеко. И он не диванный эксперт и мечтатель: успешный и предприниматель, и инвестор, он не просто треплется —
он делает и финансирует. Весьма успешно. Он на протяжении 40 лет успешно практикует то, что декларирует: вместо типичных для «экспертов» тупых экстраполяций — парадоксальные, но выполнимые сценарии.
За 10 минут своей зажигательной TED-речи он рассказывает и о ИИ для всех (в учебе, медицине, творчестве), и о городах без автотранспорта, и о миллиардах человекоподобных и универсально умелых роботов… И еще много о чем: 12 красивых идей.
Поднимите себе настроение:)
https://www.ted.com/talks/vinod_khosla_12_predictions_for_the_future_of_technology
2024/06/30 20:54:29
Back to Top
HTML Embed Code: