AI项目与工具

SPAR

SPAR是一种自我博弈框架,专为增强大型语言模型的指令遵循能力设计。它通过生成者和完善者的角色互动,利用树搜索技术和迭代优化,提升模型的自我完善能力。实验显示,SPAR在多个基准测试中表现出色,适用于智能助手、客户服务、教育技术及医疗咨询等多个应用场景。

ChefBot

ChefBot是一款基于AI技术的个性化食谱生成工具,能够根据用户提供的食材和饮食偏好,在短时间内生成定制化食谱,帮助用户高效规划餐食、减少食物浪费,同时支持健康饮食管理与烹饪技能提升。其功能包括AI驱动的食谱生成、个性化餐食规划、节约时间及减少食物浪费等,广泛适用于家庭烹饪、健康饮食管理、烹饪新手培训以及创意菜肴开发等多个场景。

axiom.ai

axiom.ai 是一款面向网页任务自动化的无代码 Chrome 扩展工具,支持数据抓取、表单填写及用户界面操作的自动化,具备与第三方服务集成的能力和 AI 辅助功能,可显著提高工作效率并保障数据安全。

AbletonMCP

AbletonMCP 是一个开源工具,通过模型上下文协议(MCP)将 Ableton Live 与 Claude AI 连接,实现音乐制作过程中的 AI 辅助。支持双向通信,允许用户通过 AI 创建和编辑 MIDI 与音频轨道、选择乐器和效果、控制播放等。技术上采用 JSON 协议和套接字通信,适用于音乐创作、实时制作、教学及音频后期处理等多种场景。

Remento

Remento是一款将口头回忆转化为个性化纪念册的服务,基于Speech-To-Story™技术,将录音转写为书面故事并制成精美书籍。用户可通过提示或上传照片激发记忆,从任何设备轻松录制回答,支持文字编辑与定制化处理,同时保留原始录音的QR码链接。主要应用于家族历史记录、老年人生活回忆、节日庆典、教育传承及个人生命故事记录等领域。

阶跃星辰推出移动端AI智能问答助手跃问APP

跃问是一款基于阶跃星辰Step系列通用大模型开发的移动应用,具备强大的文本和图像处理能力,能够高效完成内容创作、逻辑推理、数据分析等任务。该应用支持联网搜索、文档解析、推理速度优化,并具备拍照识图和语音输入功能。跃问还提供了高效阅读、智能问答、写作翻译和多端同步等功能,为用户提供便捷的信息获取和处理体验。

HOVER

HOVER是一款由英伟达研发的1.5M参数量的小型模型,专注于人形机器人复杂动作的控制。其核心功能涵盖多模式控制、运动学位置跟踪、关节角度跟踪及统一命令空间设计,通过策略蒸馏与模拟训练实现高效技能迁移,广泛应用于导航、桌面操作、移动操作及远程操控等场景。

Eagle

Eagle是一个由英伟达开发的多模态大模型,专长于处理高分辨率图像,提高视觉问答和文档理解能力。该模型采用多专家视觉编码器架构,通过简单的特征融合策略实现图像内容的深入理解。Eagle模型已开源,适用于多个行业,具有高分辨率图像处理、多模态理解、多专家视觉编码器、特征融合策略和预对齐训练等特点。

百聆

百聆是一款开源语音对话系统,融合语音识别、语音活动检测、大语言模型和语音合成技术,实现自然流畅的语音交互。支持低延迟运行,无需GPU,适用于边缘设备。具备记忆、工具调用和任务管理等功能,适用于智能家居、个人助理、车载系统等多种场景,提供高效的语音交互解决方案。

Fancy123

Fancy123是一种基于深度学习的3D网格生成工具,利用单张图像生成高质量3D模型。其核心技术包括多视图扩散模型、大型重建模型、外观增强模块、保真度增强模块及反投影操作,能够有效解决多视图图像的局部不一致问题,提升网格保真度和清晰度。该工具适用于虚拟现实、游戏开发、影视制作等多个领域,具备高度灵活性和实用性。