返回首页 内部办公网 English
当前位置:首页 > 新闻中心 > 缤纷师生
第4期“互联”学术沙龙—“基于人工智能及大数据的智慧教育”顺利举行
( 发布日期:2020-11-13 阅读:次)

主  题:基于人工智能及大数据的智慧教育

时  间:11月11日(周三)13:30 - 14:30

主讲人:董黎刚

地  点:信电楼204会议室

记录人:尹彦尚、戴剑锋

内  容:

现有的教育技术研究成果虽然很多,但是真正得到推广应用的成果却非常有限。加上2020年突然爆发的疫情给教育技术发展带来了重大机遇,面向应用的教育技术研究将有广阔的市场前景。

在这次讲座中老师先是介绍了基于人工智能及大数据的智慧教育的研究背景和意义,现有的教育资源分布不均衡以及资源无法有效共享,科学规划推动教育专网建设,完善国家数字教育资源公共服务体系,启动国家中小学生网络学习平台建设。由于科技的变革,教育也可以借助人工智能,更全面地服务于学生和教师。其次就是一些典型领域以及所用到的关键技术,典型领域主要有教育智能管理与服务、智能教师助理、智能学习过程支持等方面,主要用到的关键技术有自然语言处理、知识图谱、与计算与大数据、人机自然交互等。最后,选择了两个具体内容进行了阐述,分别是基于自然语言处理的问题自动生成和自动问答,基于自安全技术的软件定义网络。

基于自安全技术的软件定义网络方面主要针对SDN多控制器异常检测方法研究进行了阐述,先是了解到研究背景及意义, SDN使创建和引入网络新功能变得更容易,简化网络管理,促进网络演进,提供了比传统网络更健壮、更经济的网络流量动态控制功能,现已经被许多应用领域所采用。其中SDN安全也得到了越来越多的关注,研究自安全的SDN网络设备变得越来越重要,自安全的SDN网络设备能够保证自身的安全性,不仅可以主动检测网络攻击,而且能有效地对攻击进行预测和防御。在SDN安全问题研究方面大多数是对单个SDN控制器网络的安全分析与防御,没有很好的将异常检测与自安全防御相结合。

接下来就是关于SDN的相关技术,主要有SDN体系架构和OpenFlow协议。SDN体系架构主要有三层从上到下依次为应用层、控制层和基础设施层。应用层与控制层通过API连接,基础设施层与控制层通过控制数据平面接口进行连接(如OpenFlow)。OpenFlow是SDN架构中定义的一个控制器与转发层之间的通信接口标准,允许直接访问和操作网络设备的转发平面。OpenFlow的思想是分离控制平面和数据平面,二者之间使用标准的协议通信;数据平面采用基于流的方式进行转发。相应的每一层都存在着安全问题,控制平面主要有攻击者可能会向控制器发送伪装的南向/北向接口对话消息或者向控制器发起DoS或其他方式的资源消耗攻击以及控制器运行在通用操作系统上,操作系统中存在的漏洞将会成为控制器的安全漏洞。在数据平面存在着攻击者将特定服务类型的数据流进行欺骗“拦截”,攻击运行状态不稳定的网络节点,进行拒绝服务攻击,LLDP拓扑发现协议攻击,恶意/虚假流规则的注入等安全问题。应用层平面攻击者可以查询部署系统的配置,并且部署自己的网络设置,恶意/虚假流规则的注入。

针对以上安全性问题,学长进行了SDN多控制器异常检测方法研究。先是分析了基于拜占庭的SDN结构,然后利用BFT机制进行异常检测,通过分析每一个从控制器的不一致的处理信息,每一个从控制器都能够检测到被攻击的SDN设备,并且将正确的信息下发到交换机中。从控制器接收交换机上收到的流表更新命令的反馈以及状态更新信息,与已存储的更新信息对比,判断当前设备信息是否被篡改。在SDN系统中,我们尝试预测攻击者可能将什么作为目标。由于在新的协议、新的控制器软件和新的部署方式下,SDN攻击的方式是未知的,故基于SDN架构,我们可以预测攻击者最可能攻击的地方。如果把自己置身攻击者的角度,或许会发现架构的不足之处,然后就可以提前对架构中的不足之处进行安全强化。研究基于自安全技术的软件定义网络,以精准高效的安全防护、检测、分析技术作为基础,为SDN应用场景提供全面的安全防护能力。

如何教会机器理解自然语言形式的文本,让人和机器的交流变得更加智能和方便,是当下自然语言处理碰到的长远挑战。基于自然语言的问题自动生成和自动问答的论述主要先对研究背景和现状进行了简单阐述。自动问答是指在有了一定知识储备的情况下,机器能够回答对其知识范围内的自然语言形式的提问。问题生成是指机器在阅读并理解一段文本之后,能够针对该文本提出相关问题。近年来,随着深度学习技术的突飞猛进,并且在自动问答领域取得了不错的成果,越来越多的学者将深度学习技术运用于问题自动生成以及自动问答领域。

接下来是学姐对于知识图谱的构建方法以及结构的介绍。知识图谱的构建技术主要分为两部分:实体抽取和实体关系识别。实体抽取也叫命名实体识别,目的是从输入语句中识别出特定实体。实体抽取就是对语句中的每个元素都进行分类与定位,因此可以将实体抽取任务转换为序列标注任务。目前实体抽取的方法大致可以分为三类:基于规则和词典的方法、基于统计概率的方法和基于深度学习的方法(混合方法)。实体关系识别主要是根据语句信息以及句子中的实体得到实体间的语义关系。传统的基于机器学习的实体关系识别方法需要用到大量的人工标注数据集,并且需要从数据集中选择并提取合适的特征进行实体关系识别,提取的特征的质量会直接影响到最终实体关系识别的效果。基于深度学习的实体关系识别算法,由于不需要过多的人工干预就可以让模型学习并自行提取句子特征,被广泛应用于实体关系识别任务中。

针对基于模板和序列生成模型的问题生成方法存在的问题,例如生成的问题种类单一,语言形式不丰富,主题实体不明确等,将知识图谱构建与自动问答、问题生成相结合,能够有效的提高生成的答案与问题的的准确率和专业性。基于知识图谱的自动问答功能分别利用实体抽取功能抽取问句中的实体以及利用关系规则匹配功能根据问句关键词找到相应的关系标签。根据输入问句类型的不同转换为不同形式的三元组,在知识图谱中进行匹配搜寻正确答案。基于模板的问题生成框架包括两个阶段:模板收集和问题生成。“模板收集”模块负责从训练集中的问题中提取问题模板,以形成用于某些关系的模板池。“问题生成”模块将从模板库中随机选择的模板和输入的三元组用于生成目标问题。


1.jpg             2.jpg

3.jpg


参加人:研一研二部分学生

分享到:0
上一条: 第5期“互联”学术沙龙—“Beyond Trans-Dimensional Sampling: Generalised Bayesian Model Selection”顺利举行 2020/11/24
下一条: 第3期“互联”学术沙龙—“量子信息技术”顺利举行 2020/11/5
Copyright © 2020 iee.zjgsu.edu.cn.cn All Rights Reserved. 浙江工商大学信息与电子工程学院 版权所有
浙ICP备05073962号 浙公网安备33011802000512号