模型

AigcCafe

AIGC Cafe 是一个专门为 Al 爱好者和开发者提供的平台,它提供了一系列的 AI 模型供用户使用和学习。

像塑

抖音AR特效开放平台,通过像塑抖音,您可以组合不同的素材与能力来构建可应用于人脸、身体或场景的炫酷趣味AR视效。

GeneralDyG

GeneralDyG是一种由南洋理工大学提出的通用动态图异常检测方法,适用于社交网络、电商、网络安全和金融等领域。该工具通过时间 ego-graph 采样、图神经网络和时间感知 Transformer 模块,有效捕捉动态图的多尺度特征,具备高适应性和计算效率。实验证明其性能优于多种主流方法,具有广泛的应用前景。

VILA

VILA-U 是一款由 MIT 汉实验室开发的统一基础模型,整合了视频、图像和语言的理解与生成能力。它通过自回归框架简化模型结构,支持视觉理解、视觉生成、多模态学习和零样本学习等功能。VILA-U 在预训练阶段采用混合数据集,利用残差向量量化和深度变换器提升表示能力,适用于图像生成、内容创作辅助、自动化设计、教育和残障人士辅助等多种场景。

PixelDance

字节跳动研发的一种视频生成模型,PixelDance通过结合文本指导和首尾帧图片指导的方式,能够生成具有复杂场景与动作的视频。

心辰Lingo语音大模型

实现了从语音输入到语音输出的全程无缝对接,心辰Lingo能够直接理解语音内容,捕捉语气、节奏和情绪,并以同样丰富的语音形式进行回复。

Audimee

一款由AI驱动的音乐创作工具,专注于为音乐人和制作人提供创新的声乐处理功能。用户可以使用Audimee将自己的声乐转换为免版税的声音,甚至可以训练自己的声音模型。