- 该案例基于昇腾服务器,以广告词生成任务为例,使用 11 万数据对 GLM4-9B-Chat 模型进行微调。涵盖服务器购买、环境安装、模型与数据集下载、数据预处理、模型微调、评估及推理等流程,介绍了在昇腾环境下基于 LLaMa Factory 框架进行模型优化的具体操作与方法。 该案例基于昇腾服务器,以广告词生成任务为例,使用 11 万数据对 GLM4-9B-Chat 模型进行微调。涵盖服务器购买、环境安装、模型与数据集下载、数据预处理、模型微调、评估及推理等流程,介绍了在昇腾环境下基于 LLaMa Factory 框架进行模型优化的具体操作与方法。
- 本文介绍柯依力 YOLO 训练调优,包括 NPU 环境准备与训练,如创建桶、授权、Notebook 等;精度对齐,用 msprobe 工具定位解决精度问题;性能调优,用 advisor 工具解决亲和 API 等问题;还给出训练加速参数推荐配置,提升训练效率。 本文介绍柯依力 YOLO 训练调优,包括 NPU 环境准备与训练,如创建桶、授权、Notebook 等;精度对齐,用 msprobe 工具定位解决精度问题;性能调优,用 advisor 工具解决亲和 API 等问题;还给出训练加速参数推荐配置,提升训练效率。
- 文章来源于时习知公众号全文约2484字,阅读约需9分钟DeepSeek的惊艳亮相让人们开始关注稀疏模式(如MoE,混合专家模型),这种模式不仅改变了AI模型的训练和推理方式,还对语料(知识)的管理和利用提出了新的挑战与机遇。接下来,笔者将从稀疏模式的特点分析出发,来探讨稀疏模式对于语料需求变化和RAG(Retrieval-Augmented Generation,检索增强生成)的影响。 PA... 文章来源于时习知公众号全文约2484字,阅读约需9分钟DeepSeek的惊艳亮相让人们开始关注稀疏模式(如MoE,混合专家模型),这种模式不仅改变了AI模型的训练和推理方式,还对语料(知识)的管理和利用提出了新的挑战与机遇。接下来,笔者将从稀疏模式的特点分析出发,来探讨稀疏模式对于语料需求变化和RAG(Retrieval-Augmented Generation,检索增强生成)的影响。 PA...
- AI大模型的挑战与实践:DeepMind的经验分享随着人工智能技术的迅猛发展,AI大模型逐渐成为各大科技公司及研究机构的研发重点。DeepMind,作为Google旗下的人工智能研究机构,一直走在AI大模型技术的前沿。本文将深入探讨AI大模型在实践中的挑战及DeepMind的应对策略,并结合代码实例,展示一些实践经验。 AI大模型的背景与发展AI大模型,通常指的是参数量极大、计算能力需求极... AI大模型的挑战与实践:DeepMind的经验分享随着人工智能技术的迅猛发展,AI大模型逐渐成为各大科技公司及研究机构的研发重点。DeepMind,作为Google旗下的人工智能研究机构,一直走在AI大模型技术的前沿。本文将深入探讨AI大模型在实践中的挑战及DeepMind的应对策略,并结合代码实例,展示一些实践经验。 AI大模型的背景与发展AI大模型,通常指的是参数量极大、计算能力需求极...
- 网上有许多DeepSeek训练技术的相关文章,但大部分都涉及到大量技术术语,非专业人士不容易理解。为了让大家能够快速理解DeepSeek,笔者把网络知识结合自己的思考,用一种通俗的方式来给大家讲解DeepSeek的训练技术。 DeepSeek-R1中提到的模型训练流程如下: 看不懂?没关系,接下来我们用通俗的例子来讲明白里面原理。 01 R1-Zero (R1模型的前世)DeepSeek团队... 网上有许多DeepSeek训练技术的相关文章,但大部分都涉及到大量技术术语,非专业人士不容易理解。为了让大家能够快速理解DeepSeek,笔者把网络知识结合自己的思考,用一种通俗的方式来给大家讲解DeepSeek的训练技术。 DeepSeek-R1中提到的模型训练流程如下: 看不懂?没关系,接下来我们用通俗的例子来讲明白里面原理。 01 R1-Zero (R1模型的前世)DeepSeek团队...
- msModelSlim支持多种模型压缩算法(包括量化压缩、稀疏压缩等),为开发者提供更加灵活、高效的模型压缩量化方案。 msModelSlim支持多种模型压缩算法(包括量化压缩、稀疏压缩等),为开发者提供更加灵活、高效的模型压缩量化方案。
- 本文将会介绍一些更高阶的并行方式,如序列并行(SP),上下文并行(CP),混合序列并行Ulysess,ZeRO系列并行优化策略,完全分片数据并行(FSDP)。并且,在文章最后将汇总所有介绍过的并行方案与它们的通信模式,帮助读者初步建立起分布式训练与集合通信的知识结构体系。 本文将会介绍一些更高阶的并行方式,如序列并行(SP),上下文并行(CP),混合序列并行Ulysess,ZeRO系列并行优化策略,完全分片数据并行(FSDP)。并且,在文章最后将汇总所有介绍过的并行方案与它们的通信模式,帮助读者初步建立起分布式训练与集合通信的知识结构体系。
- 感受深度思考的震撼,通俗易懂地带你了解为什么DeepSeek会如此之火? 感受深度思考的震撼,通俗易懂地带你了解为什么DeepSeek会如此之火?
- 本案例主要内容是基于云主机使用Spotlight实现电商平台推荐系统,Spotlight是一个面向推荐系统的Python库,它利用PyTorch的强大计算能力,构建了一系列深浅不一的推荐模型。 本案例主要内容是基于云主机使用Spotlight实现电商平台推荐系统,Spotlight是一个面向推荐系统的Python库,它利用PyTorch的强大计算能力,构建了一系列深浅不一的推荐模型。
- 文章来源于时习知公众号全文约2029字,阅读约需7分钟。随着人工智能技术的快速发展,AI Agent成为大模型研究的热点。AI Agent是一种具备主动思考和行动能力的智能体,能够自主感知环境、形成记忆、规划和执行任务,并能与其他Agent协作。但是AI Agent的发展也面临较多的挑战,下面我们就来深入探讨一下。 01 AI Agent发展现状 AI Agent是指通过训练大规模的神经网... 文章来源于时习知公众号全文约2029字,阅读约需7分钟。随着人工智能技术的快速发展,AI Agent成为大模型研究的热点。AI Agent是一种具备主动思考和行动能力的智能体,能够自主感知环境、形成记忆、规划和执行任务,并能与其他Agent协作。但是AI Agent的发展也面临较多的挑战,下面我们就来深入探讨一下。 01 AI Agent发展现状 AI Agent是指通过训练大规模的神经网...
- 华为云Stack构建ModelArts数据工程套件,为大模型高效率高质量供数 华为云Stack构建ModelArts数据工程套件,为大模型高效率高质量供数
- 致力于借助先进科技技术,赋能数字农业技术装备提升改造的杭州盈禾嘉田科技有限公司,运用AI+大数据技术为农民提供便捷高效的农业科技服务,通过整合和连接产业链中的技术专家、农资服务商和农产品销售渠道资源,构建标准化种植追溯体系与大数据分析能力,为政府及行业用户提供专业解决方案,服务于农作物种植管理工作,在作物长势分析、病虫害调查、农事操作记录、采收期果实管理等田间种植各环节工作中实现自动识别、自动计数 致力于借助先进科技技术,赋能数字农业技术装备提升改造的杭州盈禾嘉田科技有限公司,运用AI+大数据技术为农民提供便捷高效的农业科技服务,通过整合和连接产业链中的技术专家、农资服务商和农产品销售渠道资源,构建标准化种植追溯体系与大数据分析能力,为政府及行业用户提供专业解决方案,服务于农作物种植管理工作,在作物长势分析、病虫害调查、农事操作记录、采收期果实管理等田间种植各环节工作中实现自动识别、自动计数
- 为抓住AI大模型技术变革的机遇,通过AI辅助内部业务,提升华为内部各业务领域的作业效率和质量,项目组组织训战让各业务领域懂AI用AI。我参加了上周(6月20日至22日)的第六期训战(for HR领域),收获非常大,必须分享给大家。 为抓住AI大模型技术变革的机遇,通过AI辅助内部业务,提升华为内部各业务领域的作业效率和质量,项目组组织训战让各业务领域懂AI用AI。我参加了上周(6月20日至22日)的第六期训战(for HR领域),收获非常大,必须分享给大家。
- 解难题做难事,重塑干行万业 解难题做难事,重塑干行万业
- 推进代码大模型的发展,共创产业价值 推进代码大模型的发展,共创产业价值
上滑加载中
推荐直播
-
华为云鸿蒙应用入门级开发者认证
2025/06/11 周三 16:00-17:30
Skye / 华为云学堂技术讲师
本次直播专为备考华为云鸿蒙端云应用入门级开发者认证的学员设计,提供系统的考试辅导。深度解析认证核心知识点,涵盖HarmonyOS介绍、应用开发入门、ArkTS语言、声明式开发范式组件、Stage应用模型、玩转服务卡片、鸿蒙应用网络请求开发、鸿蒙应用云函数调用等内容。
回顾中 -
基于昇腾NPU的合成孔径雷达成像案例
2025/06/12 周四 19:00-20:00
李阳 华为开发者布道师-高校教师
介绍合成孔径雷达算法的原理和优势,了解合成孔径雷达在传统计算中的痛点,分享如何使用昇腾NPU和AscendC语言构建信号处理算子,如何助力信号处理领域的高性能计算。
回顾中 -
华为云GaussDB入门级认证 - 考试辅导
2025/06/13 周五 16:00-17:30
Steven / 华为云学堂技术讲师
本次直播为HCCDA-GaussDB认证考试提供全面辅导,旨在帮助学员深入了解数据库技术原理与应用实践。我们将详细解析考试大纲,分享高效备考策略,并讲解关键知识点,包括但不限于SQL操作介绍、GaussDB数据库管理与运维基础等。
回顾中
热门标签