5.4 基于草图交互的多模态视频摘要生成与可视化分析