AI项目与工具

Qwen3

Qwen3 是阿里巴巴推出的下一代大型语言模型,支持“思考模式”和“非思考模式”,适用于复杂与简单任务。具备 119 种语言支持,优化了编码与 Agent 能力,数据量达 36 万亿 token,采用四阶段训练流程。提供多种模型配置,涵盖从轻量级到企业级应用。在多项基准测试中表现优异,广泛应用于文本生成、机器翻译、法律文书、技术文档、医疗辅助等领域。

easegen

Easegen 是一款开源的 AI 工具,支持数字人课程的制作与管理。它能够批量生成 PPT 课件、克隆数字人形象和声音,并通过 AI 技术实现视频渲染和智能出题。其核心功能包括课程制作、视频管理、智能课件生成、数字人克隆及声音克隆,旨在提升教学内容的互动性和趣味性。Easegen 的技术基础涵盖人工智能、计算机视觉、自然语言处理和语音合成等,适用于在线教育、企业培训、学术研究、语言学习及职业培训

Auphonic

Auphonic是一款利用人工智能技术的在线音频后期处理工具,提供自动音量平衡、降噪、混响减少、滤波、静音剪切等功能,适用于播客制作、广播电台、电影视频制作等多个场景,支持多语言语音转文字及视频章节生成,提供免费和多种付费订阅方案。

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列,具备从5.9M到632.1M参数的多种模型,适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略,训练效率比同类模型高2至3倍,在多模态任务中表现优异。支持可变大小patch输入,兼具灵活性与高效性,广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

DeckSpeed

DeckSpeed是一款基于AI的智能演示文稿生成工具,通过自然语言交互实现个性化内容创作。用户可实时调整设计元素,无需依赖模板,提升制作效率与灵活性。适用于商业、教育、学术、产品推广等多个领域,满足多样化的演示需求。

Amadeus Code

Amadeus Code 是一款基于 AI 的音乐创作工具,可自动生成旋律与和弦,支持多种音乐风格,适用于个人创作、团队协作及音乐教育等多种场景。用户可免费使用基础功能,如生成 MIDI 文件并导入 DAW 进行编辑,也可选择按需或订阅方式获取更多高级功能,提升创作效率与多样性。

漫剪猫

漫剪猫是一款基于AI的小说转漫画视频工具,可将文本故事智能化地转换为漫画风格的视频内容。它具备智能分镜生成、AI绘制及配音、丰富的素材库、简单的剪辑操作以及高效导出分享功能。这款工具适用于小说视觉化、社交媒体内容创作、教育培训等多个场景,助力用户轻松实现个性化编辑和高质量输出。

SynCD

SynCD是由卡内基梅隆大学与Meta联合开发的高质量合成训练数据集,用于提升文本到图像模型的定制化能力。它通过生成同一对象在不同视角、光照和背景下的图像,结合共享注意力机制和3D资产引导,确保对象一致性。该数据集支持无调优模型训练,提升图像质量和身份保持能力,广泛应用于个性化内容生成、创意设计、虚拟场景构建等领域。

潮际主设

潮际主设是一款基于AI技术的时尚设计工具,专为服装设计师提供支持。它涵盖款式生成、局部优化、图案设计和颜色替换等功能,通过智能化操作提升设计效率,并支持个性化定制与快速原型制作,适用于服装设计、趋势预测及颜色搭配等多个领域。

Inf

Inf-DiT是由清华大学与智谱AI联合开发的图像上采样技术,基于扩散模型并引入单向块注意力机制(UniBA),有效降低内存消耗,支持超高分辨率图像生成。其采用扩散变换器(DiT)架构,具备灵活的图像上采样能力,并通过全局图像嵌入和交叉注意力机制增强图像的一致性与质量。该技术适用于设计、影视、印刷及医学等领域,具有广泛的应用前景。