学习

Caricaturer.io

一个在线漫画生成器,使用 AI 和深度学习将你的肖像照片转换为漫画图片。生成有趣的、夸张的自画像,并给肖像照片添加艺术和夸张效果。

CodeDPO

CodeDPO是一款由北京大学与字节跳动合作开发的代码生成优化框架,主要功能包括提升代码准确性、优化代码效率、集成偏好学习、自动生成与验证代码及测试用例、构建优化数据集以及减少对外部资源的依赖。它采用自生成与验证机制、PageRank启发式算法及Direct Preference Optimization等技术,广泛应用于自动化软件开发、代码辅助编写、编程教育、代码质量保障及优化重构等领域。

PhotoPrism

PhotoPrism是一款开源的AI照片管理工具,采用Go语言开发,支持用户在本地服务器上运行,确保数据隐私与安全性。它通过AI技术实现照片的智能分类与搜索,涵盖人物、物体和场景识别,还支持RAW、JPG等多种文件格式,提供面部识别、地理标签及WebDAV同步等功能,适用于个人、家庭、企业和教育机构等多样化需求。

LongLLaVA

LongLLaVA是由香港中文大学(深圳)研究团队开发的多模态大型语言模型,结合Mamba和Transformer模块,利用2D池化技术压缩图像token,大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异,特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化,支持多种多模态输入处理,广泛应用于视频分析、医学影像诊断、环境监测等领域。

OpenDeepSearch

OpenDeepSearch 是一款开源深度搜索工具,结合语义重排与多源信息整合技术,提升搜索精度与覆盖范围。支持与 Hugging Face SmolAgents 无缝集成,具备语义搜索、多模式处理及可扩展性强等特点,适用于复杂问题解答、实时信息检索及学术研究等场景。

SpeciesNet

SpeciesNet 是 Google 开发的 AI 模型,用于识别相机陷阱图像中的动物物种,支持超过 2000 种标签分类,涵盖动物、分类群及非生物对象。基于 6500 万张图像训练,具备高效数据处理和跨场景识别能力,适用于野生动物监测、生物多样性研究及生态保护。模型开源,可在 GitHub 获取,支持开发人员部署与优化。

Explainpaper

Explainpaper是一款基于人工智能的文献阅读工具,通过自然语言处理技术帮助用户解析学术论文。它允许用户高亮并获取对难解内容的简化解释,提供深度解析和在线问答服务。此外,该工具还能推荐相关参考文献,并根据不同用户的学术背景提供适配的解释深度。其应用场景包括学术研究、教育支持、跨学科学习、行业分析和技术预研等领域。 ---

SwiftAgent 2.0

SwiftAgent 2.0 是一款依托于大模型与 AI Agent 技术的企业级数据分析工具,旨在帮助企业实现从数据到决策的智能化升级。其主要特点包括统一语义层构建、多源数据集成、实时交互体验以及持续学习优化机制,广泛应用于业务决策支持、销售预测、客户洞察及财务规划等多个领域。

SeedEdit

SeedEdit是一款基于自然语言指令的通用图像编辑工具,能够实现修图、换装、风格转换等多种编辑功能。它在图像重建与生成之间找到最佳平衡,支持零样本学习和多轮编辑操作,确保高质量输出。SeedEdit适用于社交媒体、广告、电商、艺术创作等多个领域,提供从简单调整到复杂创意的全面解决方案。