学习

DCEdit

DCEdit是一款基于双层控制机制的图像编辑工具,结合精确语义定位策略与视觉、文本自注意力优化,提升图像编辑的准确性和可控性。无需额外训练即可应用于现有扩散模型,支持复杂场景下的精细编辑任务,如对象替换、颜色调整等,适用于广告、影视、社交媒体等多个领域。

Hertz

Hertz-Dev是一款由Standard Intelligence开发的开源音频模型,专注于低延迟实时对话AI。它具备强大的音频生成与处理能力,能够处理和生成高质量的音频信号,并支持多任务微调,适用于语音识别、语音合成等多种应用场景。此外,Hertz-Dev还提供了音频自动编码、流式生成等功能,广泛应用于智能助手、客户服务、语音识别及合成等领域。

CatchMe

一款为识别图片、视频和音频内容是否由人工智能生成而设计的AI内容检测器

密歇根大学安娜堡分校

密歇根大学安娜堡分校(University of Michigan, Ann Arbor),也译作密西根大学安娜堡分校,于1817年建校 ,是密歇根大学系统的旗舰校区。因此通常“密歇根大学”就能代指“密歇根大...

汉王语音王

汉王语音王是一款由汉王科技开发的智能语音应用程序,集成了AI语音记录、翻译和同声传译等功能。基于自主研发的多模态大模型,它支持高精度的语音转写、拍摄与录音同步、智能总结和实时翻译,适用于多语言环境。通过集成OCR技术,它能够生成图文并茂的多媒体记录,显著提高工作效率。

AnyCharV

AnyCharV是一款由多所高校联合研发的角色可控视频生成框架,能够将任意角色图像与目标场景结合,生成高质量视频。它采用两阶段训练策略,确保角色细节的高保真保留,并支持复杂的人-物交互和背景融合。该工具兼容多种文本生成模型,具备良好的泛化能力,适用于影视制作、艺术创作、虚拟现实等多个领域。

企鹅读伴

企鹅读伴是一款专为中小学生设计的AI阅读辅助工具,依托腾讯混元大模型与元器平台,提供个性化书目推荐、多模式阅读、互动提问、角色扮演及游戏化激励等功能。通过“阅读-思考-创造”闭环设计,提升学生的阅读兴趣与语文核心素养,适用于日常学习、家庭共读、教学辅助及教育资源补充等场景。

麻省理工学院

麻省理工学院(Massachusetts Institute of Technology),简称“麻省理工”(MIT),创立于1861年,位于美国马萨诸塞州波士顿都市区剑桥市,主校区依查尔斯河而建,是一所享誉世界...