#工具 #自动化
VideoLingo-全自动视频搬运工具
VideoLingo是一款自动化的下载、翻译、配乐的视频工具
主要:
- 🍖 全自动视频搬运工,生成 Netflix 品质的字幕!
- 🎤 克隆自己的声音进行配音!
- ✨ 在 streamlit 中点击-完成!
Github:https://github.com/Huanshere/VideoLingo
特点
- 使用 NLP 和 LLM 进行字幕分割
- 智能术语知识库,实现上下文感知翻译
- 三步翻译过程:直接翻译 – 反思 – 改进
- 精确的单词级字幕对齐
- 极低成本:仅需 0.1 元即可创作 5 分钟的跨语言字幕
- GPT-SoVits 高质量的个性化配音
- 开发者友好:逐步结构化文件,便于自定义
硬件要求
- 在 Mac M1 Pro 16G 及 Windows RTX4060
VideoLingo-全自动视频搬运工具
VideoLingo是一款自动化的下载、翻译、配乐的视频工具
主要:
- 🍖 全自动视频搬运工,生成 Netflix 品质的字幕!
- 🎤 克隆自己的声音进行配音!
- ✨ 在 streamlit 中点击-完成!
Github:https://github.com/Huanshere/VideoLingo
特点
- 使用 NLP 和 LLM 进行字幕分割
- 智能术语知识库,实现上下文感知翻译
- 三步翻译过程:直接翻译 – 反思 – 改进
- 精确的单词级字幕对齐
- 极低成本:仅需 0.1 元即可创作 5 分钟的跨语言字幕
- GPT-SoVits 高质量的个性化配音
- 开发者友好:逐步结构化文件,便于自定义
硬件要求
- 在 Mac M1 Pro 16G 及 Windows RTX4060
#微信 #go 微信机器人Windows协议 支持 文本 语音条 xml 图片 文件 发送 拍一拍 不支持视频 ,可在任意系统运行,不依赖于windows
https://github.com/yitiaoaishuijiaodexianyu/WeChatAgents_go
https://github.com/yitiaoaishuijiaodexianyu/WeChatAgents_go
GitHub
GitHub - yitiaoaishuijiaodexianyu/WeChatAgents_go: 微信机器人Windows协议 支持 文本 语音条 xml 图片 文件 发送 拍一拍 不支持视频 ,可在任意系统运行,不依赖于windows
微信机器人Windows协议 支持 文本 语音条 xml 图片 文件 发送 拍一拍 不支持视频 ,可在任意系统运行,不依赖于windows - yitiaoaishuijiaodexianyu/WeChatAgents_go
#AI
auto-video-generateor AI自动解说类视频生成器
介绍
该项目是一个自动视频生成器,它可以根据给定的主题自动生成解说视频。用户输入主题文字后,系统会调用大型语言模型生成相应的故事或解说文本,随后利用语音合成接口生成解说的语音,并通过图像生成接口创建与文本内容相符的配图。最后,系统将语音和配图融合在一起,生成完整的解说视频。
项目地址:https://github.com/kuangdd2024/auto-video-generateor
实现这个系统需要多个步骤,包括生成故事文本、分句、语音合成、图像生成、生成视频,以及使用Gradio进行交互。。
- 步骤 1: 生成故事文本 为了简化,我们先手动创建一个示例故事文本。
- 步骤 2: 分句 使用re库或自然语言处理工具将文本分句。
- 步骤 3: 语音合成 使用pyttsx3库或其他语音合成模型进行语音合成。
- 步骤 4: 文生图 使用pillow库或其他文生图模型生成图片。
- 步骤 5: 生成视频 使用moviepy库将图片和音频组合成视频。
- 步骤 6: 使用Gradio实现交互 使用gradio库创建一个简单的交互界面。
资源校对交互页面
校对用于合成视频的文本、语音和图像资源,可以进行修改或重新生成,直到满意为止。。
使用方法
执行代码
# 参数可选:1 2 3 4
python main.py 4
打开浏览器
http://127.0.0.1:8000/
界面:
交互操作
用户在gradio界面输入主题文字,生成并编辑故事文本,然后生成语音、图片资源,最终合成视频。
注意事项
1. 生成视频后会把生成的文本、语音、图片的多媒体材料保存到目录中(默认:mnt/materials/[时间戳])。
auto-video-generateor AI自动解说类视频生成器
介绍
该项目是一个自动视频生成器,它可以根据给定的主题自动生成解说视频。用户输入主题文字后,系统会调用大型语言模型生成相应的故事或解说文本,随后利用语音合成接口生成解说的语音,并通过图像生成接口创建与文本内容相符的配图。最后,系统将语音和配图融合在一起,生成完整的解说视频。
项目地址:https://github.com/kuangdd2024/auto-video-generateor
实现这个系统需要多个步骤,包括生成故事文本、分句、语音合成、图像生成、生成视频,以及使用Gradio进行交互。。
- 步骤 1: 生成故事文本 为了简化,我们先手动创建一个示例故事文本。
- 步骤 2: 分句 使用re库或自然语言处理工具将文本分句。
- 步骤 3: 语音合成 使用pyttsx3库或其他语音合成模型进行语音合成。
- 步骤 4: 文生图 使用pillow库或其他文生图模型生成图片。
- 步骤 5: 生成视频 使用moviepy库将图片和音频组合成视频。
- 步骤 6: 使用Gradio实现交互 使用gradio库创建一个简单的交互界面。
资源校对交互页面
校对用于合成视频的文本、语音和图像资源,可以进行修改或重新生成,直到满意为止。。
使用方法
执行代码
# 参数可选:1 2 3 4
python main.py 4
打开浏览器
http://127.0.0.1:8000/
界面:
交互操作
用户在gradio界面输入主题文字,生成并编辑故事文本,然后生成语音、图片资源,最终合成视频。
注意事项
1. 生成视频后会把生成的文本、语音、图片的多媒体材料保存到目录中(默认:mnt/materials/[时间戳])。
GitHub
GitHub - kuangdd2024/auto-video-generateor: 自动视频生成器,给定主题,自动生成解说视频。用户输入主题文字,系统调用大语言模型生成故事或解说的文字,然后进一步调用语音合成接口生成解说的语音,调用文生图接口生成契…
自动视频生成器,给定主题,自动生成解说视频。用户输入主题文字,系统调用大语言模型生成故事或解说的文字,然后进一步调用语音合成接口生成解说的语音,调用文生图接口生成契合文字内容的配图,最后融合语音和配图生成解说视频。 - kuangdd2024/auto-video-generateor
#美化 #截图 #工具 在线截图美化工具,支持添加批注,裁剪,局部放大、在线划线等,并预设各社媒尺寸和导出高清图
https://github.com/CH563/image-beautifier?tab=readme-ov-file
https://github.com/CH563/image-beautifier?tab=readme-ov-file
GitHub
GitHub - CH563/image-beautifier: 在线截图美化工具,支持添加批注,裁剪,局部放大等,并预设各社媒尺寸和导出高清图
在线截图美化工具,支持添加批注,裁剪,局部放大等,并预设各社媒尺寸和导出高清图. Contribute to CH563/image-beautifier development by creating an account on GitHub.
#文件
Streamshare-免费30天文件传输存储站,单文件最大支持1.5T
介绍
Streamshare是一个临时文件传输站
官网:https://streamshare.wireway.ch
Raycast扩展:https://www.raycast.com/PandaDEV/streamshare-uploader
它支持
- 上传 CI 工件 *
- 发送文件给朋友
- 文件存储 30 天(使用 Streamshare 作为小型云)
- 发送文件用于商业用途
- 单文件最大1.5T
Streamshare-免费30天文件传输存储站,单文件最大支持1.5T
介绍
Streamshare是一个临时文件传输站
官网:https://streamshare.wireway.ch
Raycast扩展:https://www.raycast.com/PandaDEV/streamshare-uploader
它支持
- 上传 CI 工件 *
- 发送文件给朋友
- 文件存储 30 天(使用 Streamshare 作为小型云)
- 发送文件用于商业用途
- 单文件最大1.5T
Raycast
Raycast Store: Streamshare Uploader
Upload files to streamshare.
#AI
VectorVein-无代码AI工作流程序
介绍
向量脉络是一个结合了 AI 的无代码工作流平台,可以通过简单的拖拽,结合自己的日常工作、业务流程,快速构建出自己的 AI 应用,实现你的私人订制 AI 生产线
官网:https://vectorvein.ai/zh
通过邀请链接可获得 2000 积分奖励:https://vectorvein.ai/user/register?ref=b460gz
Github:https://github.com/AndersonBY/vector-vein
特征
智能体聊天
不满足于单个工作流的能力?你可以赋予智能体多个工作流,在与智能体聊天中让 AI 帮你判断并运行工作流
图形化设计
无需代码编程,只需拖拽工作流节点并按照您的需求进行逻辑连接即可快速创建强大的工作流。 有编程基础还想进一步扩展功能?我们提供了自定义编程节点,让您可以自由发挥!
工作流应用
工作流效果不错想让朋友试试?通过秘钥管理和分享工作流,让您的朋友也能体验到您的工作流!
工作流模板
工作流模板是由向量脉络团队和社区用户提供的一些常用的工作流程,您可以直接将其添加到您的工作流空间中。
以 官方工作流模板 为例,我们尝试选择 🔀任意语言文章总结生成中文思维导图,在页面中点击添加到我的工作流按钮,即可将该工作流模板添加到您的工作流空间中。
工作流详情
在 我的工作流 页面中,您可以看到您的工作流空间中的所有工作流程。刚刚从工作流模板库中添加的工作流程也会显示在这里。
进入到刚刚添加的工作流里,您可以看到工作流的详细信息,包括名称、简介、标签、更新时间等。如果对添加的工作流有不清楚的地方,您可以点击简介来查看关于该工作流模板的更多详细介绍信息
VectorVein-无代码AI工作流程序
介绍
向量脉络是一个结合了 AI 的无代码工作流平台,可以通过简单的拖拽,结合自己的日常工作、业务流程,快速构建出自己的 AI 应用,实现你的私人订制 AI 生产线
官网:https://vectorvein.ai/zh
通过邀请链接可获得 2000 积分奖励:https://vectorvein.ai/user/register?ref=b460gz
Github:https://github.com/AndersonBY/vector-vein
特征
智能体聊天
不满足于单个工作流的能力?你可以赋予智能体多个工作流,在与智能体聊天中让 AI 帮你判断并运行工作流
图形化设计
无需代码编程,只需拖拽工作流节点并按照您的需求进行逻辑连接即可快速创建强大的工作流。 有编程基础还想进一步扩展功能?我们提供了自定义编程节点,让您可以自由发挥!
工作流应用
工作流效果不错想让朋友试试?通过秘钥管理和分享工作流,让您的朋友也能体验到您的工作流!
工作流模板
工作流模板是由向量脉络团队和社区用户提供的一些常用的工作流程,您可以直接将其添加到您的工作流空间中。
以 官方工作流模板 为例,我们尝试选择 🔀任意语言文章总结生成中文思维导图,在页面中点击添加到我的工作流按钮,即可将该工作流模板添加到您的工作流空间中。
工作流详情
在 我的工作流 页面中,您可以看到您的工作流空间中的所有工作流程。刚刚从工作流模板库中添加的工作流程也会显示在这里。
进入到刚刚添加的工作流里,您可以看到工作流的详细信息,包括名称、简介、标签、更新时间等。如果对添加的工作流有不清楚的地方,您可以点击简介来查看关于该工作流模板的更多详细介绍信息
#翻译
DeeplxFile-跨平台不限制文件大小的文件翻译工具
这是一个基于Deeplx提供的免费,不限制文件大小的文件翻译工具
Github:https://github.com/infrost/DeeplxFile
下载:https://pan.quark.cn/s/402aec95dd8d
说明
Windows
提供了编译好的exe版本, 直接双击运行即可
从源代码运行
你也可以下载源代码, 然后运行
python deeplxfile.py
MacOS
右键解压出来的文件夹,选择在文件夹打开新终端, 终端中输入
./deelxfile
版本说明
现已完全支持Word,Excel
powerpoint 支持翻译大部分内容
运行项目后会在目录下生成config.json 设置save_original为true即可保留原文
直连模式
该模式不依赖deeplx的内核,使用的是自己实现的请求方法
DeeplxFile-跨平台不限制文件大小的文件翻译工具
这是一个基于Deeplx提供的免费,不限制文件大小的文件翻译工具
Github:https://github.com/infrost/DeeplxFile
下载:https://pan.quark.cn/s/402aec95dd8d
说明
Windows
提供了编译好的exe版本, 直接双击运行即可
从源代码运行
你也可以下载源代码, 然后运行
python deeplxfile.py
MacOS
右键解压出来的文件夹,选择在文件夹打开新终端, 终端中输入
./deelxfile
版本说明
现已完全支持Word,Excel
powerpoint 支持翻译大部分内容
运行项目后会在目录下生成config.json 设置save_original为true即可保留原文
直连模式
该模式不依赖deeplx的内核,使用的是自己实现的请求方法
GitHub
GitHub - infrost/DeeplxFile: 基于Deeplx和Playwright提供的简单易用,快速,免费,不限制文件大小,支持超长文本翻译,跨平台的文件翻译工具 / Easy-to-use, fast, free, unlimited…
基于Deeplx和Playwright提供的简单易用,快速,免费,不限制文件大小,支持超长文本翻译,跨平台的文件翻译工具 / Easy-to-use, fast, free, unlimited file size and cross platform file translation tool based on Deeplx & Playwright that suppor...
#AI #数字人 一个高自由度的端到端的可定制AI-VTuber。支持对接哔哩哔哩直播间,以智谱API作为语言基座模型,拥有意图识别、长短期记忆(直接记忆和联想记忆),支持搭建认知库、歌曲作品库,接入了当前热门的一些语音转换、语音合成、图像生成、数字人驱动项目,并提供了一个便于操作的客户端。
https://github.com/whoiswennie/AI-Vtuber
https://github.com/whoiswennie/AI-Vtuber
GitHub
GitHub - whoiswennie/AI-Vtuber: 一个高自由度的端到端的可定制AI-VTuber。支持对接哔哩哔哩直播间,以智谱API作为语言基座模型,拥有意图识别、长短期记忆(直接记忆和联想记忆),支持搭建认知库、歌曲作品库,接入了当前…
一个高自由度的端到端的可定制AI-VTuber。支持对接哔哩哔哩直播间,以智谱API作为语言基座模型,拥有意图识别、长短期记忆(直接记忆和联想记忆),支持搭建认知库、歌曲作品库,接入了当前热门的一些语音转换、语音合成、图像生成、数字人驱动项目,并提供了一个便于操作的客户端。 - whoiswennie/AI-Vtuber
#AI
GPT Engineer – AI聊天构建web程序
介绍
GPT Engineer 是一款 AI Web 构建器应用程序,可让您仅使用自然语言快速构建真正的 Web 应用程序,GPT Engineer 目前擅长构建前端应用程序。但是,将 GPT Engineer 与其他工具配对将允许您构建全栈 Web 应用程序
官网:https://gptengineer.app
案例
创建项目
要创建新项目,请登录 ,然后在文本框中写下要构建的内容。gptengineer.app
编写完要构建的内容后,单击按钮。Create
这将带您进入生成页面,您可以在其中查看为您生成的代码。完成后,您将看到一个弹出窗口,将您带到编辑器,您可以在其中预览站点
部署和共享
Web 应用程序准备就绪后,您可以部署它或与全世界共享它。您还可以共享正在进行的版本以收集反馈。GPT Engineer 只需单击几下即可轻松发布和共享您的应用程序。
聊天以闪电般的速度构建网站和网络应用程序。
您拥有代码。使用 AI 或您选择的 IDE 进行编辑。
一键部署,或使用您选择的托管服务提供商。
GPT Engineer – AI聊天构建web程序
介绍
GPT Engineer 是一款 AI Web 构建器应用程序,可让您仅使用自然语言快速构建真正的 Web 应用程序,GPT Engineer 目前擅长构建前端应用程序。但是,将 GPT Engineer 与其他工具配对将允许您构建全栈 Web 应用程序
官网:https://gptengineer.app
案例
创建项目
要创建新项目,请登录 ,然后在文本框中写下要构建的内容。gptengineer.app
编写完要构建的内容后,单击按钮。Create
这将带您进入生成页面,您可以在其中查看为您生成的代码。完成后,您将看到一个弹出窗口,将您带到编辑器,您可以在其中预览站点
部署和共享
Web 应用程序准备就绪后,您可以部署它或与全世界共享它。您还可以共享正在进行的版本以收集反馈。GPT Engineer 只需单击几下即可轻松发布和共享您的应用程序。
聊天以闪电般的速度构建网站和网络应用程序。
您拥有代码。使用 AI 或您选择的 IDE 进行编辑。
一键部署,或使用您选择的托管服务提供商。
gptengineer.app
GPT Engineer
Build software products, using only a chat interface
#AI
Not Diamond-免费的多种LLM大模型无成本使用
介绍
Not Diamond 是一个 AI 模型路由器,可自动确定哪个 LLM 最适合响应任何查询,通过将多个 LLM 组合成一个元模型来学习何时调用每个 LLM,从而提高 LLM 输出质量。
官网:https://chat.notdiamond.ai
模型支持
GPT-4o
GPT-4 Turbo
GPT-4o Mini
Claude 3 Opus
Claude 3 Haiku
Claude 3.5 Sonnet
Gemini 1.5 Pro
Gemini 1.5 Pro (0801)
Llama 3.1 70B
Llama 3.1 405B
Perplexity
主要特点
- 最大化输出质量:Not Diamond 始终为每个提示调用最佳模型,从而在主要评估基准上优于每个基础模型。
- 降低成本和延迟:进行智能成本和延迟权衡,以高效利用更小、更便宜的模型,而不会降低质量。
- 带有反馈的个性化路由:根据每个最终用户的反馈,实时对他们进行超级个性化路由。
- 训练您自己的自定义路由器:利用您的评估数据来训练针对您的使用案例进行优化的自定义路由器。
Not Diamond-免费的多种LLM大模型无成本使用
介绍
Not Diamond 是一个 AI 模型路由器,可自动确定哪个 LLM 最适合响应任何查询,通过将多个 LLM 组合成一个元模型来学习何时调用每个 LLM,从而提高 LLM 输出质量。
官网:https://chat.notdiamond.ai
模型支持
GPT-4o
GPT-4 Turbo
GPT-4o Mini
Claude 3 Opus
Claude 3 Haiku
Claude 3.5 Sonnet
Gemini 1.5 Pro
Gemini 1.5 Pro (0801)
Llama 3.1 70B
Llama 3.1 405B
Perplexity
主要特点
- 最大化输出质量:Not Diamond 始终为每个提示调用最佳模型,从而在主要评估基准上优于每个基础模型。
- 降低成本和延迟:进行智能成本和延迟权衡,以高效利用更小、更便宜的模型,而不会降低质量。
- 带有反馈的个性化路由:根据每个最终用户的反馈,实时对他们进行超级个性化路由。
- 训练您自己的自定义路由器:利用您的评估数据来训练针对您的使用案例进行优化的自定义路由器。
#AI
Anthropic的Claude Artifacts的可破解开源版本,AI对话构建程序
介绍
这是 Anthropic 的 Claude Artifacts 和 Vercel v0 的开源版本,由 E2B 制作的 Code Interpreter SDK 提供支持,你可以理解为模型完全可以自己控制,带来更好的使用体验
演示示例:
Github:https://github.com/e2b-dev/ai-artifacts
演示:https://artifacts.e2b.dev
特征
- 基于 Next.js 14(App Router)、TailwindCSS、Vercel AI SDK。
- 使用 E2B 的 Code Interpreter SDK 安全地执行 AI 生成的代码。
- 在 UI 中流式传输。
- 可以安装和使用 npm、pip 中的任何软件包。
- 支持的堆栈(添加您自己的堆栈):
◦ 🔸 Python 解释器
◦ 🔸 Next.js
Anthropic的Claude Artifacts的可破解开源版本,AI对话构建程序
介绍
这是 Anthropic 的 Claude Artifacts 和 Vercel v0 的开源版本,由 E2B 制作的 Code Interpreter SDK 提供支持,你可以理解为模型完全可以自己控制,带来更好的使用体验
演示示例:
Github:https://github.com/e2b-dev/ai-artifacts
演示:https://artifacts.e2b.dev
特征
- 基于 Next.js 14(App Router)、TailwindCSS、Vercel AI SDK。
- 使用 E2B 的 Code Interpreter SDK 安全地执行 AI 生成的代码。
- 在 UI 中流式传输。
- 可以安装和使用 npm、pip 中的任何软件包。
- 支持的堆栈(添加您自己的堆栈):
◦ 🔸 Python 解释器
◦ 🔸 Next.js
Change Clothes AI
⭐️ 网站功能:AI 试衣
📁 网站简介:一种在线AI服装更换工具,通过先进的AI算法分析用户的照片和服装图片,生成逼真的用户穿着新服装的图像。
🔗 网站链接:点击打开
⭐️ 网站功能:AI 试衣
📁 网站简介:一种在线AI服装更换工具,通过先进的AI算法分析用户的照片和服装图片,生成逼真的用户穿着新服装的图像。
🔗 网站链接:点击打开
青梧字幕
⭐️ 软件功能:AI智能提取翻译视频字幕
➡️ 支持平台:#Windows #macOS
📁 软件简介:一款智能字幕生成和编辑工具,可以通过上传本地视频自动生成字幕,并进行自由编辑和翻译。
支持下载srt、vtt、lrc等常见字幕格式,提供单语和双语字幕选项。
⬇️ 软件下载:点击下载
⭐️ 软件功能:AI智能提取翻译视频字幕
➡️ 支持平台:#Windows #macOS
📁 软件简介:一款智能字幕生成和编辑工具,可以通过上传本地视频自动生成字幕,并进行自由编辑和翻译。
支持下载srt、vtt、lrc等常见字幕格式,提供单语和双语字幕选项。
⬇️ 软件下载:点击下载
Qijingdict
青梧字幕-首页
青梧字幕是一款视频字幕自动提取工具,字幕提取之后可以继续翻译,最终可以生成多种格式的字幕
#AI #抠图
小宾AI抠图
如题,一个 AI 抠图工具,基于 briaai/RMBG-1.4 开源模型,支持 jpg/png/gif/webp/bmp 等格式,支持批量抠图和格式转换,适用于 Windows 和 macOS,完全免费,无需注册。
主页 丨 项目地址
小宾AI抠图
如题,一个 AI 抠图工具,基于 briaai/RMBG-1.4 开源模型,支持 jpg/png/gif/webp/bmp 等格式,支持批量抠图和格式转换,适用于 Windows 和 macOS,完全免费,无需注册。
主页 丨 项目地址
小宾AI抠图
小宾AI抠图 - 免费开源AI图像处理工具
探索免费开源AI图像处理工具,支持一键抠图、证件照制作、图片格式转换。
强大的数学软件 GeoGebra 多平台适用 #教学 #数学
GeoGebra ,一款教育数学软件,可以帮助学生和教师探索、学习和教授各种数学概念和科学领域的知识。融合了几何、代数、微积分、概率、统计和其他数学领域的工具,以及绘图和计算功能。
支持Windows、macOS、Linux、网页端、iOS 和 Android
🧐 点击下载 😊 点击访问
GeoGebra ,一款教育数学软件,可以帮助学生和教师探索、学习和教授各种数学概念和科学领域的知识。融合了几何、代数、微积分、概率、统计和其他数学领域的工具,以及绘图和计算功能。
支持Windows、macOS、Linux、网页端、iOS 和 Android
🧐 点击下载 😊 点击访问
GeoGebra
GeoGebra kalkulyatorlari va ilovalarini bepul yuklab olish
Barcha qurilmalar va operatsion tizimlar uchun mavjud boʻlgan matematika va fan boʻyicha bepul kalkulyatorlarimiz va oʻquv ilovalarimizni oʻrganing
design-material
⭐️ 网站功能:设计资源合集
📁 网站简介:一个为独立开发者提供丰富设计资源的GitHub网页,包括动画库、插图库、图标库等。
收录了国内外优秀的设计工具和资源,如CSS3动画效果、插画素材、图标库、Logo生成工具等,支持个人和商业用途。
🔗 网站链接:点击打开
⭐️ 网站功能:设计资源合集
📁 网站简介:一个为独立开发者提供丰富设计资源的GitHub网页,包括动画库、插图库、图标库等。
收录了国内外优秀的设计工具和资源,如CSS3动画效果、插画素材、图标库、Logo生成工具等,支持个人和商业用途。
🔗 网站链接:点击打开
GitHub
GitHub - YOYZHANG/design-material: Design material for indie hackers
Design material for indie hackers. Contribute to YOYZHANG/design-material development by creating an account on GitHub.