blog | 第12页 | 昨日为序

如何评估大模型在特定任务上的真实性能随着大语言模型等人工智能技术的快速发展，评估这些模型在特定任务上的真实性能变得至关重要。一个全面、严谨的评估不仅能揭示模型的当前能力水平，还能…

blog 2026年2月2日

大模型多轮对话状态管理的工程实现方案在构建基于大语言模型的多轮对话系统时，对话状态管理是确保对话连贯性、一致性与个性化体验的核心工程挑战。一个高效的工程实现方案需要妥善处理历史上…

blog 2026年2月2日

检索增强生成（RAG）系统通过结合外部知识库与大语言模型的生成能力，显著提升了信息处理的准确性与可靠性。然而，其效果很大程度上取决于检索结果的相关性以及生成环节的质量。以下将从多个…

blog 2026年2月2日

大模型与向量数据库结合的最佳架构设计随着大语言模型（LLM）的广泛应用，其与向量数据库的结合已成为构建高效、智能应用的关键。这种结合能够有效解决大模型固有的知识静态性、幻觉问题以…

blog 2026年2月2日

从零搭建企业级私有大模型服务平台在人工智能浪潮席卷全球的当下，大模型已成为企业寻求创新与效率突破的关键技术。然而，公有云模型服务在数据安全、合规可控、模型定制和成本长期可控方面存…

blog 2026年2月2日

大模型API成本优化：缓存、批处理与模型蒸馏实践随着大模型API在各类应用中的集成日益广泛，其调用成本已成为企业运营中不容忽视的因素。高昂的API费用可能源于频繁调用、处理大量文…

blog 2026年2月2日

想要在Mac上轻松体验本地大语言模型（LLM）的强大功能？无需复杂配置和强大显卡，借助Ollama，你现在可以一键运行各种开源模型。它就像Mac上的Docker，专门用于简化大模型…

blog 2026年2月2日

大模型幻觉问题的成因与缓解策略近年来，以大语言模型为代表的生成式人工智能技术取得了突破性进展，展现出强大的内容生成与对话能力。然而，这些模型在实际应用中经常产生一个被称为“幻觉”…

blog 2026年2月2日

如何构建基于大模型的智能客服系统随着人工智能技术的快速发展，大型语言模型为智能客服系统带来了质的飞跃。与传统基于规则或有限意图识别的客服机器人相比，基于大模型的系统能更自然地理解…

blog 2026年2月2日

大模型上下文长度扩展方法对比：RoPE插值 vs ALiBi 随着大型语言模型在长文本理解、多轮对话、长文档处理等任务上的需求日益增长，突破其预训练阶段的固定上下文长度限制成为一个…

blog 2026年2月2日