图像 - 智狐AI导航

纳米搜索

纳米搜索是一款由360集团开发的多功能AI搜索引擎，支持文字、语音、拍照和视频等多种搜索方式，涵盖从简单到复杂的全方位解答方案。它整合了16款顶尖大模型能力，配备了智能工具，如写作、翻译和旅游规划助手，旨在提升多场景下的操作效率。此外，其独特的AI脱口秀功能，能将搜索结果转化为视频内容，为用户提供更直观的知识获取体验。

AI项目与工具 2025年06月12日 13 点赞 0 评论 812 浏览

WebSSL

WebSSL是由Meta和纽约大学等机构开发的视觉自监督学习模型，基于大规模网络图像数据训练，无需语言监督即可学习有效视觉表示。其包含多个变体，参数规模从3亿到70亿不等，在多模态任务如视觉问答、OCR和图表理解中表现出色。通过筛选含文本图像数据，显著提升特定任务性能。模型具备良好的扩展性，适用于智能客服、文档处理、医疗影像分析等多个领域。

AI项目与工具 2025年06月11日 92 点赞 0 评论 811 浏览

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型，能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器（VAE）和因果Transformer架构，支持自回归生成与跨模态信息共享，特别擅长图像生成、多模态语言模型及文本到语音合成等任务，其提出的σ-VAE进一步提升了模型的鲁棒性。

AI项目与工具 2025年06月12日 67 点赞 0 评论 811 浏览

Publer AI Assist

Publer AI Assist 使用最新的人工智能技术帮助您在几秒钟内生成内容、创建令人惊叹的图像并像专业人士一样回复评论。

裂变增长 2025年06月05日 66 点赞 0 评论 811 浏览

ComfyGen

ComfyGen是一款基于大型语言模型（LLM）的文本到图像生成系统，能够根据用户提供的文本提示自动生成高质量图像。它通过结合多种专业组件如微调基础模型、LoRAs、嵌入技术和超分辨率处理等构建复杂工作流，并采用两种基于LLM的方法优化图像生成质量，适用于艺术创作、游戏开发、广告设计、电影制作等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 810 浏览