学习 - 智狐AI导航

佐治亚理工学院

佐治亚理工学院（Georgia Institute of Technology，又称乔治亚理工学院，简称Georgia Tech，Gatech，GT），1885年建校，是一所坐落于佐治亚州首府亚特兰大的公立研究型大学，美...

教育学习 2026年06月24日 0 点赞 0 评论 595 浏览

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列，具备从5.9M到632.1M参数的多种模型，适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略，训练效率比同类模型高2至3倍，在多模态任务中表现优异。支持可变大小patch输入，兼具灵活性与高效性，广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

AI项目与工具 2025年06月11日 58 点赞 0 评论 595 浏览

Product Hunt

一个集产品展示、社区互动和市场验证于一体的平台，Product Hunt让独立开发者有机会展示自己的作品和进行市场验证，让用户们有机会发现最新和最有趣的产品。

独立开发 2025年06月05日 32 点赞 0 评论 594 浏览

Liquid

Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架，通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间，使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本，提升视觉生成与理解性能，并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用，适用于创意设计、内容创作及智能交互等领域。

AI项目与工具 2025年06月12日 82 点赞 0 评论 594 浏览

OmniParse

OmniParse是一款开源数据解析平台，支持多种文件类型的非结构化数据转换为结构化格式，包括文档、图像、视频、音频及网页内容。其核心功能涵盖表格提取、图像字幕生成、音视频转录以及网页内容结构化处理，利用自然语言处理、光学字符识别及深度学习技术提升解析效率与准确性。OmniParse完全在本地运行，确保数据隐私与安全，广泛应用于文档自动化处理、客户服务、市场研究、法律合规及医疗记录管理等领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 594 浏览