模型

AtomThink

AtomThink是一个由多所高校与企业联合研发的多模态数学推理框架,通过构建长链思维(CoT)引导多模态大型语言模型(MLLMs)进行复杂推理。它包含自动CoT注释引擎、原子步骤微调策略及多种搜索策略,旨在提升原子步骤质量并增强MLLMs的推理能力。AtomThink提出的大规模多模态数据集AtomMATH及其评估方法为模型训练和测试提供了重要支持,广泛应用于教育辅助、自动化测试、学术研究等领域

Claude 3.7 Sonnet

Claude 3.7 Sonnet 是由 Anthropic 推出的混合推理模型,支持标准模式与扩展思考模式,适用于复杂任务处理和日常交互。其在数学、物理、编程等领域表现卓越,尤其在代码生成与理解方面领先。模型优化了安全性,减少误拒率,并支持多平台接入。适用于软件开发、前端设计、科学计算及企业自动化等多个场景。

云合AI

基于百度文心4.0大模型,以及自身在产业服务领域深耕10年沉淀、打磨出的产业大数据,为产业办公人群提供专精学习、全球产业新闻、资讯以及办公提速工具。

DanceFusion

DanceFusion是一款由清华大学开发的开源框架,专注于音频驱动的舞蹈动作生成与重建。它采用分层时空Transformer-VAE和扩散模型,能够处理不完整或嘈杂的数据,生成与音乐高度同步的逼真舞蹈动作。该工具支持多种应用场景,包括内容创作、虚拟现实、互动娱乐、舞蹈教育以及动画制作等,展现了其在多领域的应用价值。

Voice Changer

Voice Changer是一款基于状态空间模型的音频处理工具,可将音频中的语音转换为不同音色,同时保留情感和表达细节。用户可通过选择预设声音库或克隆个人声音实现个性化转换,并对语音细节进行精细调整。该工具广泛应用于内容创作、游戏配音、有声书制作及品牌音频开发等领域,提供高质量的音频输出和灵活的控制选项。

CSM.Ai

CSM.ai是一家来自美国的支持使用AI从视频、图像或文本创建3D资产。用户只需上传任意一张2D图像即可获得对应的3D模型。

Merlin AI

一个基于OpenAI的ChatGPT技术的浏览器扩展,Merlin AI能够在用户的浏览器上提供一键访问ChatGPT、GPT-4、Claude和Llama等高级语言模型的功能。

CodeSquire.ai

CodeSquire.ai是一款针对数据科学领域的AI编程助手,基于大型语言模型开发,支持代码自动补全、注释转代码、基于库构建函数及自然语言转SQL查询等功能,旨在提升开发者效率与代码质量。它适用于数据预处理、特征工程、模型训练与评估以及数据可视化等多个场景,可无缝嵌入Google Colab、BigQuery和JupyterLab等常用平台。

ShowUI

ShowUI是一款由新加坡国立大学Show Lab与微软合作开发的视觉-语言-行动模型,旨在提升图形用户界面(GUI)助手的工作效率。该模型通过UI引导的视觉令牌选择、交错视觉-语言-行动流以及高质量数据集的运用,实现了高效的零样本截图定位和GUI自动化功能,广泛应用于网页自动化、移动应用测试、桌面软件自动化及游戏自动化等领域。

文心百中

一款基于百度文心大模型推出的创新搜索产品,文心百中通过极简的框架设计和新一代语义向量搜索模式,实现了搜索效果与效率的双重突破,为企业和开发者提供了更加高效和便捷的搜索解决方案。