Telegram Web Link
MemeCam —— 来自 AI 的幽默

🤡 现在表情包和梗图已然成为了社交网络的副语言,热点话题下 Meme 从来不会缺席。为了让万物皆可梗化,交互设计师 Andreas Refsgaard情境肖像的那位)和朋友一起做了一个快速生成 Meme 的网站「MemeCam」

📸 将手头的图片上传或者直接拍照,选择配文的位置、关键词和语言,MemeCam 就能立刻生成一张指定的梗图(有点日本大喜利的意味)。MemeCam 通过 BLIP 来识别图片内容,GPT 3.5 来生成配文,不过由于每次调用 API 都会产生费用,目前只得限定每小时出图 10 张

🤣 语言幽默是基于认知的转化,而当前的 AI 并非真的读懂了图片,所以 MemeCam 的幽默质量也经常「反复横跳」,但终究还是被逗笑了

频道:@RollerRolling
Midjourney 挖角了前 Vision Pro 硬件负责人

Midjourney 计划进军硬件领域,已于去年十二月聘请前苹果 Vision Pro 的硬件工程管理 Ahmad Abbas 担任硬件负责人。Abbas 与Midjourney 创始人 David Holz 均有丰富的硬件经验,目前正在开发一个名为 Orb 的项目,该硬件团队目前专注于 3D 数据捕获以用于 AI 训练。关于硬件的具体信息尚未披露,但可推测它将用于 AI 生成的 3D 世界和实时视频游戏。Holz 曾提到,他设想未来会有一款配备 AI 处理器的游戏机,能够实时生成游戏

频道:@RollerRolling
🗒 Andy Matuschak 曾在 Apple 工作期间参与了最早期的 iOS 开发,现在在全职做一位独立的研究开发人员,你可以在 Patreon 上面赞助并且解锁他的研究分享

📝 针对不同的主题,他也会在他的博客上面分享他所写的笔记。今天想要和大家分享他使用 Vision Pro 的笔记。这篇笔记还在不断的被更新中:

🔸 硬件方面,它具有与苹果中端笔记本(M2芯片)相当的计算能力,拥有先进的传感器/摄像头阵列和高分辨率显示屏

🔸 软件方面,操作系统 visionOS 基于 “应用程序” 的概念,保持了传统的 WIMP 界面范式,并通过眼动追踪和手势控制实现交互

🔸 尽管硬件包装雄心勃勃,但软件范式相对保守。作者还讨论了 Apple 在输入方法、文本输入、以及与 Meta 和 MagicLeap 公司愿景不同的策略

🔸 此外,他也提出了一些对于更具野心的交互方式的看法和梦想,推荐大家有空去翻阅一下~

频道:@RollerRolling
Sora —— 文字生成视频

🎞 最近 OpenAI 发布的文字生成视频技术 Sora 引起了轩然大波。和众多GenAI 技术类似,Sora 能够根据文本描述生成长达 60 秒的视频,从目前直接生成不经调整的产出来看,它的效果非常惊人

🦾 Sora 拥有构建复杂场景和角色生成的能力,对于超现实的描述也能很好还原。另外,它也有为同一叙事生成多镜头的能力,非常适用于商业广告和电影预告。更重要的是 Sora 展现出了它对于真实物理世界的理解力,这也正是 GenAI 转为 AGI 不可或缺的一步

🧐 目前 Sora 还未面向大众用户开放,如果想要体验,可以尝试在 Sam Altman 的推文下留言。若对 Sora 的技术实现有兴趣,可以查看官方的技术文档、宝玉的译文以及腾讯对其的解读

频道:@RollerRolling
Claude's Newsletter —— 语言模型的技术分享

🗞 分享 Claude 的技术团队的 newsletter 给大家,里面记录了团队针对 transformer models 的逆向工程 —— 包含了关于机器学习模型可解释性研究的文章

频道:@RollerRolling
Sora Gallery —— 一次看完所有 Sora 的公开视频

📹 几天前,OpenAI 发布了文字生成视频技术 Sora

🖼 今天跟大家分享一位热心网友搭建的 Sora Gallery,这里可以一口气看完目前为止所有公开开来的 Sora 视频以及它的 prompt

频道:@RollerRolling
This media is not supported in your browser
VIEW IN TELEGRAM
ImageFX —— Google 的新 AI 实验

🖼 谷歌的新实验 ImageFX 允许用户直接在网站上达到文生图。这个 UI 界面比较特别的地方是:它会自动识别出来一段话的所有变量,让你可以轻易的点击单词选择其他单词来控制图片里的物体

👤 使用 Google 账号登入便可体验 ImageFX

频道:@RollerRolling
▎频道推荐:订阅节点分享中心 (https://www.tg-me.com/Free166)

🪽 分享网络免费节点

✈️ 收集免费白嫖机场

💎 整合科学上网资源

▎欢迎加入:https://www.tg-me.com/Free166 (https://www.tg-me.com/Free166)
Galactic Compass —— 银河系中心指南

🪐 设计师 Matt Webb 一直想知道此时此地,银河系的中心在哪里。但要定位清楚需要考虑三个因素:

🔸 你在地球表面的位置
🔸 一天中的时间(考虑地球的自转)
🔸 一年中的时间(考虑地球的公转)

➡️ 于是乎他做了一个 APP,始终指向银河系的中心点(人马座A*),还有光连接你们所需的时间。目前只有 iOS 版,你可以在这里下载使用

🀄️ 对此,我的 GPT 对联王给出的对联是:敢问银河中心所在,自古宇宙尽头难觅

频道:@RollerRolling
Jack McVeigh —— 现代孤独的 PS 1 GIF

👾 Jack McVeigh 是一位来自墨尔本的数字艺术家,擅长 Blender 三维图像的制作

🪩 他的作品尤其是 PS 1 风格(一种老式掌机画风,特点是 Low poly)的 GIF,低精度的模型搭配现代社会场景,仿佛能定格一种持续的孤独感,可谓 marriage of retro and modern

频道:@RollerRolling
Pinch to Summarize —— AI 范式新交互

🤏🏽 这应该是我目前看过「AI 概括」功能里面最好的应用方式了:Arc 浏览器为他们的 iOS app 出了一个新功能 — 捏住网页来用 AI 概括

频道:@RollerRolling
This media is not supported in your browser
VIEW IN TELEGRAM
Creative Dialogues —— Runway 出品的 AI 访谈系列

📹 Creative Dialogues(创意对谈)是由 RunwayML 工作室出品的访谈系列,目前发行到第二集

🎨 这个系列里面的访谈对象都是真正在使用 Runway 的艺术家和创作者。有空的朋友不妨来看看他们是如何把更多的 AI 工具融入到他们的工作流当中

频道:@RollerRolling
This media is not supported in your browser
VIEW IN TELEGRAM
Pika AI 重磅更新 —— 让 AI 视频里的人讲起话来

🗣 Pika AI 刚刚发布说:「We know there’s been a lot of talk about AI generated video recently. Well, look who’s talking now!

Early Access to Lip Sync is available for Pro users now at http://pika.art.」

🫡 对的没错你能精准控制你生成的视频里的人的台词了,目前仅开放给 Pro 订阅者

频道:@RollerRolling
2024/11/20 03:22:05
Back to Top
HTML Embed Code: