大众工业:星光熠熠AI梦,技能筑梦筑未来
——一名“人工智能训练师”选手的赛后回顾
发布时间:2025-06-26      来源:上海市大众工业学校      作者:沈伊凡/文 郭燕/指导老师

在人工智能浪潮奔涌的时代,我抱着对技术的无限热忱,在AI 赛道上奔跑。从全国青少年科技教育成果展示大赛人工智能自动驾驶创新挑战赛的激烈角逐,到上海市“星光计划”第十一届职业院校技能“人工智能训练师”的严苛选拔,我实现了一次次成长与突破。

从全国青少年科技教育成果展示大赛人工智能自动驾驶创新挑战赛载誉而归后,我毅然投身“星光计划”“人工智能训练师”的选拔征程。不同于自动驾驶场景,“星光计划”聚焦多领域综合应用,对自然语言处理和计算机视觉的多模态训练能力要求极高。

在“星光计划”训练阶段,数据处理与模型构建成为核心战场。面对海量图像数据,我熟练运用labelimg工具进行精细标注。为解决社交媒体图像中复杂目标的标注难题,我自定义标签类别、调整标注框精度,完成上万张图像的标注工作,构建起高质量数据集。同时,针对数据不平衡问题,我借助labelimg的批量处理功能,对少数类样本进行重点标注,结合SMOTE算法与EasyEnsemble集成学习方法,大幅提升模型对少数类样本的识别能力。

在模型训练环节,jupyterLite成为我的“得力助手”。他在 jupyterLite 环境中搭建多模态训练框架,编写 Python 脚本对数据进行清洗和预处理,数据可用率大大提升。面对文本语义与图像特征融合难题,我基于Transformer架构,在jupyterLite中反复调试跨注意力机制的代码,通过可视化工具实时观察模型训练过程中的参数变化和性能指标。经过无数次的代码修改与模型迭代,最终使模态融合效率提升。在多语言情感分析训练时,我利用jupyterLite的交互式编程特性,快速测试不同的预训练模型微调策略,并创新设计语言特征增强模块,将多语言情感分析准确率提升了。

比赛现场,面对“融合10 种语言文本与动态视频的情感分析” 高难度任务,我依托在 jupyterLite 中积累的丰富调试经验,快速调用训练成果。我运用多线程技术并行处理数据,结合分布式计算加速模型训练,通过在 jupyterLite 中实时监控训练进程,精准调整模型参数。

回顾这段历程,我很感慨:“比赛的结果固然重要,但训练过程中积累的经验和突破才是最宝贵的财富。”这次经历让我看到了自身的不足,也明确了未来努力的方向。未来,我将继续深耕 AI 领域,为行业发展贡献更多力量。

沈_副本.jpg