芒果TV音视频算法大赛名校大厂AI高手云集硕果累累生活电器新闻资讯中反复回响
东京奥运会的盛宴即将拉开帷幕,科技之光AI也将在赛场上发光。今年的奥运会首次引入了AI辅助打分系统,让这项技术作为“裁判助手”展现其力量。这款系统通过捕捉选手动作并实时转换为三维立体图像,再由复杂算法分析选手的身体旋转和扭动等动作,最终依据精确标准判断出选手技术水平。可以说,这是机器视觉在全球体育赛事中的顶尖应用。
回到国内,工业界对于图形与音视频算法的探索与实践也不断向前。在此背景下,由中国(长沙)马栏山视频文创产业园和芒果TV联合举办的第二届“马栏山杯”国际音视频算法大赛刚刚落下帷幕。这场盛事背后,是全球Top高校与一线大厂AI人才云集。此前几年,他们持续投入资源培养扶持新兴AI技术团队,现在已有所成就。
作为音视频领域最新AI技术先行者的马栏山视频文创产业园与芒果TV,第二届“马栏山杯”国际音视频算法大赛规模庞大,评委及参赛者水准高达。截至比赛结束,本届大赛共有1959个参赛队伍、2052人次参与,比去年增长51.4%。来自全球Top级科研院校及国内一线互联网科技巨头的大咖们是AI研究学术界的一线实操者,也是最炙热的人才。
目前,大赛正式赛阶段已经全部结束,参赛者们围绕视频补全、推荐、节拍检测三个方向展开激烈对决,每个方向都有十个团队获得胜利。
视频补全
今年的大奖题目以重要行业需求为基础:借助机器学习,将通过AI分析点位和图像实现影视剧穿帮抹除、logo抹除等操作。需要以提供数据为基础进行模型训练,用AI算法实现缺失区域补全。共451支队伍参加,其中不乏国内各大小型科研机构获胜者。大奖得主惠政是一名西安电子科大博士,在阿里达摩院实习,同时也是去年同一项目第三名获得者。他采用端到端STTN网络,并使用半精度模型减少显存使用,对输入进行裁剪,以提高效率和效果。
视频推荐
本题旨在设计一个能提升点击率和有效观看时长的推荐模型,以芒果TV真实业务场景为原型设置丰富特征维度及海量数据信息。大奖得主黄钟山采用基于召回+排序+回归架构预测多任务目标,他从相关视频历史曝光点击记录、中站观看行为等层面设定7种策略,并结合lightgbm建模利用负采样、cross validation等策略优化结果。
音乐节拍检测
最后一个项目要求通过深度学习或传统方法学习音乐节奏节拍并标识时间点位。本次比赛中第一名吴健基于TCN网络和GRU+MLP网络提出了两阶段解决方案,并通过集成策略进一步提高准确性。他还采用固定FFTsize减少预测耗时,使得效率最高于torch.stft处理节拍问题。
总结来说,这些青年才俊凭借他们卓越的地球物理知识,不仅展示了人类智慧如何战胜自然,还展示了未来可能出现的人类社会模式,即更加智能、高效且环境友好的生活方式。而这些创新思路正被用来改善我们日常生活中的各种挑战,从而推进我们的社会发展路径。