课程

课程介绍

本课程聚焦AI大模型(尤其是多模态技术)在电信质调场景的落地实践,结合中国电信行业最新趋势(如星辰大模型、息壤平台等),通过技术架构解析+行业案例复盘+代码实操,帮助技术骨干掌握语音分析、多模态模型部署及解决方案设计能力,满足政企客户智能化转型需求。

培训对象

从事相关工作及对课程内容感兴趣的人员。

课程收益

掌握多模态技术架构(Gemini、九天、星辰)及电信行业落地方法论;
学习语音分离、长音频摘要生成等核心技术,并完成Pipeline搭建实战;
熟悉DeepSeek等工具链,设计电信级AI解决方案(如客服质检、故障工单分析);
获取多模态模型部署优化方案(MoE/CoE架构、息壤平台)与电信专属案例库。

知识概要

-- 多模态技术基础与语音提取实战;
-- 多模态生产部署与DeepSeek开发。

课程大纲

模块

学习内容

第一天AM

多模态架构与电信应用场景

多模态技术演进与运营商布局

原生多模态架构对比(Gemini/GPT-4o vs. 九天/星辰)

本地化部署(中国电信星辰视觉日均调用6亿+案例解析)

多模态在电信场景的应用

智能客服(多模态意图识别)

视频布控(图像+文本联动)

会议分析(语音+字幕联合分析)

语音处理技术栈解析

语音分离(FRCRN/MossFormer)

方言识别(CT-Transformer)

超自然语音生成(VITS框架)

第一天PM

语音内容提取解决方案实战

行业方案:长音频内容提取

LeMUR框架实践(10小时录音→摘要/问答/行动项)

安徽电信自服务智能体案例

行业方案:降噪与说话人分离

ClearerVoice-Studio实战(复数域算法+实时处理)

电信客服场景应用(投诉分类、情绪识别)

开发实战:语音提取Pipeline搭建

从音频上传→ASR(Whisper)→关键信息结构化(NLP实体抽取)

代码实操与调试

第二天AM

模型部署与前后端开发

大模型生产部署方案

算力调度(息壤平台)

模型蒸馏(Distil-BERT)、MoE/CoE架构优化(降低推理成本30%+)

前后端数据链路开发

前端语音采集(PyAudio)+后端AI能力集成(FastAPI+TensorRT)

电信级低延迟方案设计

电信级解决方案设计

质调场景:客服录音分析(情绪识别+关键词提取)

故障语音工单提取(声纹识别+文本生成)

第二天PM

DeepSeek与综合应用

DeepSeek-R1全解析

模型架构(Mixture-of-Experts)

微调(LoRA)

智能体编排

多模态综合应用案例

政务热线(语音→工单自动生成)

应急指挥(视频+语音联动决策系统)

结业设计

分组输出:质调中心语音质检AI方案(含技术选型/架构图)

导师点评与优化建议

认证过程

无认证考试

开班信息

暂无开班信息