AI项目与工具

Dashtoon

Dashtoon是一款基于人工智能技术的漫画创作平台,提供角色生成、背景处理、图像优化等功能,支持从故事板到漫画的全流程自动化操作。它致力于降低创作门槛,提升效率,同时为创作者提供发布与变现渠道,适用于个人娱乐、教育培训、商业营销及专业出版等场景。

AudioX

AudioX 是一种基于多模态输入的音频生成模型,支持文本、视频、图像等多种输入方式,能够生成高质量的音频和音乐。其核心创新在于多模态掩码训练策略,提升了跨模态理解和生成能力。具备零样本生成、自然语言控制及强大的泛化能力,适用于视频配乐、动画音效、音乐创作等多个场景。

CAD

CAD-MLLM 是一款基于多模态输入生成参数化 CAD 模型的系统,融合了文本、图像和点云等多种数据形式。它通过命令序列与大型语言模型的结合,实现了高效的数据对齐与处理,并提出了创新的评估指标。CAD-MLLM 具备强大的鲁棒性和交互式设计能力,适用于工业设计、建筑设计、汽车制造等多个领域。

RealisHuman

RealisHuman 是一个用于优化生成图像中人体部位的后处理框架,采用两阶段方法提升手部和面部等部位的真实性。它通过参考原始图像生成逼真结构,并重新绘制周围区域实现无缝融合,支持多种图像风格,适用于游戏、影视、艺术等领域。

WebWalker

WebWalker是阿里巴巴研发的AI工具,用于评估和优化大型语言模型在网页浏览任务中的表现。它通过多智能体框架、垂直探索策略及WebWalkerQA数据集,提升模型处理长上下文和多源信息的能力。支持多语言、多领域和多难度任务,适用于信息检索、数据分析和内容监控等场景,具备良好的适应性和可扩展性。

befunky

Befunky是一款集照片编辑、图形设计于一体的在线平台,具备裁剪、调色、滤镜应用等基础功能,以及智能背景移除、人像修饰等高级特性。其丰富的模板与素材库助力用户高效完成创意项目,广泛应用于社交媒体内容创作、个人照片优化、营销材料设计等领域。

VideoVAE+

VideoVAE+是一种由香港科技大学研发的跨模态视频变分自编码器,具备时空分离压缩和文本指导功能。它通过分离空间与时间信息处理,有效减少运动伪影,同时利用文本嵌入增强细节重建能力。VideoVAE+在视频重建质量上超越现有模型,支持高保真与跨模态重建,适用于视频压缩、影视后期制作及在线教育等多个领域。

Continue

Continue是一款开源的AI代码助手,集成于VS Code和JetBrains系列IDE中,通过聊天功能和代码补全功能帮助开发者快速理解代码并完成编写。支持实时代码编辑、动作快捷方式以及自定义模型连接,旨在提高开发效率和代码质量。

CodeFree

CodeFree是一款由中国电信研发云平台推出的AI辅助编程工具,集成了代码补全、智能问答、代码注释、代码解释、异常报错解析、单元测试生成、代码优化、测试助手、安全助手、文档助手及代码工程助手等12项功能。它贯穿软件开发的全流程,利用机器学习、深度学习、自然语言处理及上下文感知技术,帮助开发者提升效率、减少错误并优化代码质量。

Half_illustration

Half_illustration 是一款基于 Flux.1 模型的 LoRA 图像创意工具,融合了摄影写实与插画艺术的元素,创造出独特的视觉效果。该工具支持通过 API 快速生成图像,并与 Diffusers 库兼容。用户可通过详细描述和特定提示词指导模型,实现个性化的艺术创作。其应用广泛,涵盖时尚编辑、广告设计、概念艺术等多个领域。