AI项目与工具

CogSound

CogSound是一款基于AI的音效生成工具,能够为无声视频添加与内容匹配的高质量音效,涵盖多种复杂场景。该工具通过先进的音视频特征匹配技术和优化的生成算法,提升了视频的沉浸感和真实感,广泛应用于视频创作、广告制作及影视后期等多个领域。

汉语新解

汉语新解是一款利用AI技术重新诠释汉语词汇的工具,提供深度解读、创意文本生成、SVG卡片设计等功能,支持风格定制与多场景应用,旨在推动语言创新与文化传承。

PersonaCraft

PersonaCraft是一种结合扩散模型和3D人体建模的全身图像合成技术,能够从单一参考图像生成多个逼真的个性化全身图像。它支持遮挡处理、用户自定义身体形状,并通过3D感知姿态条件控制提高生成图像的质量。该工具广泛应用于社交媒体、广告、时尚、游戏及电影等领域,为个性化定制提供了强大的技术支持。

TeleChat2

TeleChat2-115B是一款由中国电信人工智能研究院开发的大型语言模型,具备强大的文本生成能力。它支持多语言处理,包括中文和英文,并且能够高效执行多种任务,如文本生成、代码编写、数据分析和语言翻译等。此外,TeleChat2-115B通过先进的架构设计,如Decoder-only结构和Rotary Embedding位置编码方法,提升了模型性能与稳定性。该模型适用于智能客服、内容创作、教育辅

Oryx

Oryx是一款由清华大学、腾讯和南洋理工大学联合开发的多模态大型语言模型,专为处理视觉数据设计。其核心技术包括预训练的OryxViT模型和动态压缩模块,支持任意分辨率的图像处理及高效的视觉数据压缩。Oryx在空间和时间理解上表现优异,广泛应用于智能监控、自动驾驶、人机交互、内容审核、视频编辑及教育等领域。

Aragon.ai

Aragon.ai 是一款基于人工智能技术的头像生成平台,通过上传照片并结合用户选定的服装和背景,快速生成高质量的专业头像。平台支持个性化定制,具备强大的图像处理能力,可一次性生成大量头像,并提供照片编辑工具。其应用场景广泛,包括职业形象打造、社交媒体展示、企业团队建设以及个人品牌塑造等领域。

mailerlite

MailerLite是一款面向小型企业和内容创作者的电子邮件营销平台,提供自动化邮件、登录页面设计、订阅表单制作及网站构建等功能。其核心特色在于AI技术支持,例如智能发送优化邮件送达时间,以及AI主题行生成器提升邮件吸引力。这些功能共同提升了用户的邮件营销效率与用户体验。

VideoGrain

VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架,支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制,提升文本提示对目标区域的控制能力,确保时间一致性与特征分离,显著优于现有T2I和T2V方法。该工具无需额外参数调整,具备高效计算性能,适用于影视制作、广告营销、内容创作等多个领域。

A2A

A2A是谷歌推出的首个智能体交互协议,旨在实现不同框架和供应商构建的AI智能体之间的高效协作。它支持多模态交互、长期任务管理和实时反馈,基于HTTP、JSON-RPC等标准设计,便于与现有系统集成。A2A具备安全性、可扩展性和用户体验协商能力,适用于企业流程自动化、跨平台客服、招聘优化、供应链协同和智能办公等多个场景。

HumanDiT

HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架,基于扩散变换器(DiT)实现姿态引导的视频生成。它支持长序列、多分辨率视频生成,并通过关键点扩散变换器(Keypoint-DiT)确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征,结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。