数据

Eagle 2.5

Eagle 2.5 是一款由英伟达开发的视觉语言模型,专注于长上下文多模态学习,具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B,但性能接近更大模型。采用信息优先采样和渐进式后训练策略,提升模型稳定性与适应性。支持多样任务,适用于视频分析、图像处理、内容创作及教育等多个领域。

Retake

Retake是一款基于人工智能技术的照片编辑和修复应用程序,主要功能包括超分辨率放大、低清人像修复、超级降噪、低光照增强和人像动漫化等。其所有AI计算均在本地进行,保障了用户的数据安全和隐私。Retake支持用户上传多张照片,通过AI分析和合成,生成高质量的照片,适用于摄影爱好者、专业摄影师、设计师、普通用户以及历史照片修复者等多种用户群体。

商汤小浣熊

商汤小浣熊由商汤科技开发,包含代码小浣熊和办公小浣熊两大模块。代码小浣熊协助开发者高效完成代码编写、测试等工作,而办公小浣熊则聚焦于复杂数据分析任务,支持数据清洗、趋势预测、可视化图表生成等。两款工具均具备高度智能化和灵活性,适用于软件开发、数据分析、编程教育等多个场景。

Rows

一款多合一的电子表格工具,Rows旨在为用户提供强大的 AI 工具,以更高效地分析、汇总和转换数据。

V-JEPA

创新的自监督学习模型,它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容,还能在图像任务上表现出色,具有广泛的应用潜力。

LongLLaVA

LongLLaVA是由香港中文大学(深圳)研究团队开发的多模态大型语言模型,结合Mamba和Transformer模块,利用2D池化技术压缩图像token,大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异,特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化,支持多种多模态输入处理,广泛应用于视频分析、医学影像诊断、环境监测等领域。

AgentReview

AgentReview是一款基于大型语言模型构建的学术同行评审模拟工具,通过模拟评审者、作者和领域主席的角色,研究评审偏见和决策机制对评审结果的影响。它支持隐私保护,无需真实敏感数据,同时验证了多种社会学理论在评审中的应用,为优化学术评审流程提供了重要参考。

Florence

Florence-2是微软Azure AI团队研发的多功能视觉模型,支持图像描述、目标检测、视觉定位和图像分割等功能。该模型基于Transformer架构,采用序列到序列学习方法,利用自注意力机制实现多模态信息融合。通过训练大规模数据集,Florence-2在多个应用场景中表现出色,包括图像和视频分析、内容审核、辅助驾驶、医疗影像分析以及零售和库存管理。

Gemini 2.0

Gemini 2.0 是谷歌推出的原生多模态AI模型,具备快速处理文本、音频和图像的能力,支持多语言输出和实时音视频流输入。通过Agent技术和工具调用,Gemini 2.0 能够自主理解任务并提供解决方案,已在编程、数据分析、游戏等领域展示应用潜力。目前提供免费试用,计划逐步开放更多功能。