学习 - 智狐AI导航

ParGo

ParGo是一种由字节与中山大学联合开发的多模态大语言模型连接器，通过结合局部与全局token，提升视觉与语言模态的对齐效果。其核心模块PGP和CPP分别提取图像的局部和全局信息，增强细节感知能力。在多个基准测试中表现优异，尤其在文字识别和图像描述任务中优势明显。采用自监督学习策略，提高模型泛化能力，适用于视觉问答、图像字幕生成、跨模态检索等多种场景。

AI项目与工具 2025年06月12日 38 点赞 0 评论 865 浏览

《Manus没有秘密》70页PPT解读AI Agent（PDF文件）

本文详细解读了AI Agent技术从L1到L3的发展历程，涵盖了定义、实现原理、用户体验及未来趋势。文章以Manus为例，探讨了Agent技术的通用性、技术实现路径及用户感知变化，强调了提升通用性、性能和用户体验的重要性。同时，文章提出了对未来发展的期望和建议。

AI项目与工具 2025年06月12日 45 点赞 0 评论 863 浏览

流畅阅读

FluentRead 是一款开源的浏览器翻译插件，基于AI技术提供精准、自然的翻译服务。支持多种翻译引擎和双语对照显示，具备隐私保护和高度定制化功能。适用于学术研究、工作场景、语言学习及日常阅读，兼容主流浏览器，保障用户数据安全。其开源特性增强了透明度与灵活性，满足多样化翻译需求。

AI项目与工具 2025年06月12日 68 点赞 0 评论 862 浏览

Llama Tutor

Llama Tutor 是一款基于 AI 的开源个性化学习平台，利用 Llama 3.1 和 Together AI 技术生成定制化学习计划，涵盖多学科领域，提供互动式学习体验和精准解答。支持个人学习、学术教育、职业发展和语言学习等应用场景，致力于打造高效、有趣的沉浸式学习环境。

AI项目与工具 2025年06月12日 77 点赞 0 评论 862 浏览

MiMic

Mimic就像一个会画画的AI朋友，你只需要给它看看你的画，它就能学会你的画风，然后帮你画出更多的画。

Ai绘画生成 2025年06月05日 53 点赞 0 评论 861 浏览

AI课代表

专门为视频站打造的AI总结助手

Ai办公效率 2026年06月23日 0 点赞 0 评论 860 浏览

AI Reality

AI Reality 是一个网站，它提供了一个使用人工智能（AI）学习和创建增强现实（AR）的平台。

Ai编程建站 2025年06月05日 64 点赞 0 评论 860 浏览

ChatTS

ChatTS-14B 是一款由字节跳动开发的大型语言模型，专为时间序列数据的理解与推理设计，具备 140 亿参数规模。通过合成数据对齐技术提升任务表现，支持自然语言交互，可应用于金融、气象、工业、医疗和运维等多个场景，提供数据分析、预测与诊断功能。模型已开源，便于开发者使用和扩展。

AI项目与工具 2025年06月11日 73 点赞 0 评论 860 浏览

MemFree

MemFree是一款开源的混合AI搜索引擎，集成了多种AI技术和搜索引擎功能，支持文本、图像、文件和网页等多种输入形式，可提供文本、思维导图、图片和视频等多格式搜索结果。其核心功能涵盖图像处理、文档总结与提问、学术问题解答、代码解释与生成等，特别适用于学术研究、工作办公和日常生活场景，旨在优化知识管理、提升生产力并降低使用成本。

AI项目与工具 2025年06月12日 42 点赞 0 评论 860 浏览

URM

URM是由阿里妈妈开发的通用推荐模型，结合大语言模型与电商领域知识，提升推荐效果。其采用多模态融合与Sequence-In-Set-Out生成方式，支持多场景、多目标、长尾及发现性推荐。具备高效率、零样本学习能力，适用于工业级推荐系统，已应用于阿里妈妈展示广告场景，优化用户体验与商家投放效果。

AI项目与工具 2025年06月11日 85 点赞 0 评论 859 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期