内容创作

MultiTalk

MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示,生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题,并采用部分参数训练和多任务训练策略,保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及

Lillian

Lillian是Scrumball推出的AI网红营销助手,基于Claude 4技术,实现网红数据分析时间从30分钟缩短至3秒,提供自定义多维分析、智能内容创作、多平台统一管理及全流程自动化功能。其支持TikTok、Instagram、YouTube等主流平台,覆盖60+国家的网红资源库,助力品牌精准定位目标受众,提高合作效率和转化率。Lillian还提供智能可视化报告,实时监控关键指标,为品牌提供

Vocloner

Vocloner是一款基于人工智能的在线语音克隆工具,用户可通过上传目标语音音频并输入文本,快速生成克隆声音,无需训练语音网络。支持多语言及多种中文方言,提供经典版本和更新版本两种克隆选项,经典版使用Coqui TTS技术,更新版采用Coqui AI的XTTS工具,增强克隆效果。功能包括即时语音克隆、模型创建与保存、多语言支持、不同说话风格和角色模仿,适用于内容创作、无障碍支持、语言学习和个性化数

Recall

Recall是一款AI知识管理工具,支持将分散的内容转化为自我组织的知识库,具备即时总结、聊天互动功能,可处理YouTube视频、PDF、文章等多种格式内容。它提供增强浏览体验,自动链接相关内容到知识图谱中,帮助用户发现关联信息。Recall支持离线使用,跨平台访问,并注重数据安全与隐私保护,用户可随时导出数据,确保数据所有权。

Hatch

Hatch是一款AI数字创意画布工具,提供无限的创作空间,能够根据用户的思考过程进行适应和调整。用户可以从一个提示、图像或问题开始,将想法以视觉化的方式进行组织和连接。它支持自由布局、无限扩展、智能生成、图像编辑、AI助手和实时协作等功能,帮助用户将创意转化为现实。适用于创意构思、项目规划和内容创作等场景。

StealthGPT

StealthGPT是一款生成“不可检测”AI文本的工具,主要面向学生和内容创作者。它通过“人类化”处理,使AI生成的内容更接近人类写作,从而绕过AI检测工具。支持多语言写作、自动化引用、格式化、图片转答案、SEO写作以及PDF辅助阅读等功能。用户可选择不同版本以满足学习、创作和商业需求。

DecipherIt

DecipherIt是一款AI驱动的研究助手工具,能够将多种主题、链接和文件转化为AI生成的研究笔记本。它提供全面的总结、互动问答、音频概述、可视化思维导图及自动化的FAQ生成等功能。基于Bright Data的MCP服务器,DecipherIt可突破地理限制和反爬虫检测,获取全球信息。同时,它采用多智能体AI框架CrewAI,高效整合多源数据,适用于学术研究、市场分析、教育学习等多个场景。

MoonCast

MoonCast 是一个零样本播客生成系统,能够从纯文本源合成自然的播客风格语音。它采用长上下文语言模型和大规模语音数据训练,支持中文和英文,生成几分钟长的高质量播客音频。MoonCast 通过特定的LLM提示生成播客脚本,并利用语音合成模块转换为最终音频,具备长音频生成、增强自然性、多语言支持和零样本语音合成等功能。其技术原理包括多阶段训练、短段级别自回归音频重建和自发性增强,适用于内容创作、教

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

PageOn.ai

PageOn.ai是一个AI驱动的内容创作平台,帮助用户快速生成高质量的视觉内容。通过AI Agent理解用户需求,自动生成动态视觉元素,如互动图表、3D模型和媒体内容。用户只需描述外观和感觉,AI即可转化为视觉表达。平台具备深度搜索功能,支持拖放和斜杠命令组合内容,打造个性化视觉故事。主要功能包括AI生成幻灯片、智能演示、数据图表生成、实时语音交互和多人协作等,适用于教学演示、商务会议、项目汇报