模型工具
23
个网站
模型评测:对AI模型在特定任务上性能表现的基准测试和对比分析;模型训练。
H2O.ai
把开源AutoML的极致性能与私有化GenAI深度研究合二为一
Sliq
云端语义清洗引擎,分钟级净化GB级脏数据,零代码接入Python/BI
大模型微调平台
零代码微调百款开源大模型,秒租GPU,一天内打造专属7B
LMArena
通过让用户匿名与两个模型对话并投票选出更好的那个,来对大模型进行排名
AI评测榜单
中文大模型权威排行榜,零成本秒选最强模型
AGI-Eval
公正、可信、科学、全面的大模型评测社区
MMBench
对模型和数据集进行并行推理和评估
Arize AI
面向企业的AI工程与可观测性平台,为生成式AI、传统机器学习及计算机视觉场景提供开发、评估到生产监控
Evidently AI
AI评估和LLM可观察性平台
FlagEval
AI大模型的评估工具包
H2O EvalGPT
企业级生成式AI评估与监控平台。 全面衡量大模型在回答相关性、上下文精度、幻觉率、偏差等关键指标上的表现。
HELM
HELM是由斯坦福大学CRFM推出的一个全面、透明、可复现的大模型评测框架。
LLMEval3
面向中文大模型的综合评测平台,为中文大模型提供公开、透明、可复现的能力评估基准。
OpenCompass
开源、高效、全面的大模型评测开放平台。包含大模型评测榜单,评测集社区,文档等专区
昇思MindSpore
全场景AI框架,集核心框架、模型、开发套件等于一体,助力产业智能升级
滚动加载更多...