AI项目与工具

DecipherIt

DecipherIt是一款AI驱动的研究助手工具,能够将多种主题、链接和文件转化为AI生成的研究笔记本。它提供全面的总结、互动问答、音频概述、可视化思维导图及自动化的FAQ生成等功能。基于Bright Data的MCP服务器,DecipherIt可突破地理限制和反爬虫检测,获取全球信息。同时,它采用多智能体AI框架CrewAI,高效整合多源数据,适用于学术研究、市场分析、教育学习等多个场景。

Chinese

Chinese-LiPS是由智源研究院与南开大学联合开发的高质量中文多模态语音识别数据集,包含100小时语音、视频及手动转录文本。其创新性融合唇读视频与幻灯片内容,显著提升语音识别性能,实验表明可降低字符错误率约35%。适用于教学、科普、虚拟讲解等复杂语境,为多模态语音识别研究提供丰富数据支持。

CodeFree

CodeFree是一款由中国电信研发云平台推出的AI辅助编程工具,集成了代码补全、智能问答、代码注释、代码解释、异常报错解析、单元测试生成、代码优化、测试助手、安全助手、文档助手及代码工程助手等12项功能。它贯穿软件开发的全流程,利用机器学习、深度学习、自然语言处理及上下文感知技术,帮助开发者提升效率、减少错误并优化代码质量。

MobileVD

MobileVD是Qualcomm AI Research团队开发的首个面向移动端优化的视频扩散模型,基于Stable Video Diffusion架构,通过降低帧分辨率、多尺度时间表示和剪枝技术,显著提升模型效率。其具备高效的去噪能力和低资源消耗,适用于短视频生成、视频编辑、游戏动画及互动视频等多种应用场景,为移动设备上的视频生成提供了强大支持。

CAD

CAD-MLLM 是一款基于多模态输入生成参数化 CAD 模型的系统,融合了文本、图像和点云等多种数据形式。它通过命令序列与大型语言模型的结合,实现了高效的数据对齐与处理,并提出了创新的评估指标。CAD-MLLM 具备强大的鲁棒性和交互式设计能力,适用于工业设计、建筑设计、汽车制造等多个领域。

Deep Art Effects

Deep Art Effects 是一款利用深度学习技术的在线工具,能够将普通照片转换为具备多种艺术风格(如梵高、毕加索等)的作品。其主要功能包括艺术风格转换、高分辨率输出、丰富的艺术风格库以及 API 集成支持。该工具适用于个人娱乐、艺术创作、教育、广告及社交媒体内容创作等多个领域。

点点

点点是一款以生活服务为核心的AI搜索应用,主要功能涵盖生活经验总结、精准避坑指南、真实用户反馈及及时信息更新。它支持用户通过文字、图片或视频形式提问,并提供互动式问答体验,旨在满足用户在日常生活中多方面的实际需求。

BioEmu

BioEmu是由微软研究院开发的生成式深度学习系统,用于高效模拟蛋白质的动态结构和平衡态构象。它能在单个GPU上每小时生成数千种蛋白质结构样本,误差控制在1 kcal/mol以内,支持功能构象变化模拟和热力学性质预测。该工具适用于科学研究、药物开发、个性化医疗等多个领域,显著提升蛋白质结构模拟的效率和精度,为生物医学研究提供强大计算支持。

Stability AI开源Stable Diffusion 3 Medium文生图模型

Stable Diffusion 3 Medium是一款由Stability AI开源的文本到图像生成模型,拥有20亿个参数,适用于消费级和企业级GPU。该模型具备照片级真实感、强大的提示理解和排版能力,以及高资源效率。此外,它还支持API试用,并得到了NVIDIA和AMD的支持,以优化其性能。Stability AI致力于开放和安全的AI应用,并计划持续改进SD3 Medium。

PDFtoChat

PDFtoChat 是一款基于 AI 技术的开源工具,支持用户通过自然语言对话与 PDF 文件交互。它具备强大的文档解析、智能检索和即时反馈能力,广泛应用于学术研究、法律咨询、商业分析、教育培训和技术文档查询等领域,显著提升文档处理效率。