AI项目与工具

Playground v3

Playground v3是一款基于大型语言模型(LLM)的文本到图像生成工具,具备240亿参数量的潜扩散架构(LDM),能够精准理解和生成复杂的图像内容,支持RGB颜色控制和多语言文本生成。其核心功能包括文本到图像生成、图形设计、RGB颜色控制和多语言支持,广泛应用于设计、内容创作、游戏开发、广告等多个领域。

Wisecut

Wisecut 是一款利用人工智能技术的在线视频编辑工具,其核心功能包括 AI 高光检测、自动字幕生成与多语言翻译、基于语音的故事板编辑、智能背景音乐匹配以及静音段落自动移除等。它特别适合用于社交媒体内容创作、视频博客、在线教育、产品营销和企业培训等领域,帮助用户快速制作高质量的短视频或音频内容。

Edicho

Edicho 是一种基于扩散模型的图像编辑工具,能够在多图像间实现一致性编辑,无需额外训练。其核心技术包括 Corr-Attention 注意力模块和 Corr-CFG 去噪策略,通过显式图像对应关系提升编辑质量与一致性。适用于图像修复、风格转换、内容创作、医学影像增强等场景,具备良好的兼容性与扩展性。

RDT

RDT是清华大学AI研究院推出的一款双臂机器人操作任务扩散基础模型,拥有十亿参数量,可自主完成复杂任务,如调酒和遛狗。该模型基于模仿学习,具备强大的泛化能力和操作精度,支持多种模态输入和少样本学习。RDT已在餐饮、家庭、医疗、工业及救援等领域展现广泛应用前景,推动机器人技术发展。

MyLens

MyLens是一款AI驱动的可视化工具,支持将文字、数据或想法转化为时间线、思维导图、象限图等多种图表形式。具备多输入格式支持、智能生成和高可定制性,适用于内容创作、商业营销、教育及数据分析等多个场景。用户可根据需求选择不同版本,满足从个人到企业级的多样化需求。

Droidrun

Droidrun是一款基于AI的Android设备自动化工具,结合视觉识别、UI解析与LLM推理技术,支持自然语言控制和多平台部署。它能执行复杂任务自动化,具备自愈机制、多LLM兼容性及丰富的扩展接口,适用于AI助手、数据交互、测试验证等多种场景。

Playground AI

Playground AI 是一款流行的人工智能绘图和图像编辑工具,主要功能包括AI文本到图像生成、创意社区作品分享、提示词智能优化和图像到图像的转换。它提供灵活的创作模式,支持用户上传现有图片或草图生成全新的艺术作品。此外,Playground AI 还提供了一个UGC创作社区,用户可以在其中发现多种风格的图片,并借鉴提示词进行创作。Playground AI 提供了免费版和多个付费版本,以满足

Peek

Peek 是一款基于人工智能的个人财务管理工具,可自动追踪用户的银行账户、信用卡及其他金融账户,实时更新收支和投资情况。它通过AI分析用户消费模式,提供个性化的财务建议,帮助用户优化开支、设定财务目标并实现长期规划。Peek 注重隐私保护与情感体验,设计友好,适合各类用户群体使用。

TITAN

TITAN是一款由哈佛医学院研究团队开发的多模态全切片病理基础模型,通过视觉自监督学习和视觉-语言对齐预训练,能够在无需微调或临床标签的情况下提取通用切片表示并生成病理报告。它在多种临床任务中表现出色,包括线性探测、少样本和零样本分类、罕见癌症检索、跨模态检索和病理报告生成,尤其适用于资源有限的临床场景。

MinMo

MinMo是阿里巴巴通义实验室推出的多模态语音交互大模型,具备高精度语音识别与生成能力。支持情感表达、方言转换、音色模仿及全双工交互,适用于智能客服、教育、医疗等多个领域,提升人机对话的自然度与效率。