巴黎人贵宾会-巴黎人的平台网址

菜单导航

一个深度学习方法来识别Twitter用户在紧急情况下

编辑:?巴黎人的平台网址 发布时间:?2019年12月12日 22:09:05

印度国立巴特那理工学院的研究人员最近设计了一种工具,用于确定紧急情况和灾害的地理位置以及参与其中的人的地理位置。他们在《国际减灾杂志》上发表的一篇论文中概述了他们的方法,利用基于卷积神经网络(CNN)的模型从推文中提取位置信息。

“在紧急情况下,事件的地理位置信息,以及受影响用户的地理位置信息,是至关重要的,”开展这项研究的研究人员之一Jyoti Prakash Singh告诉TechXplore。“确定这个地理位置是一项具有挑战性的任务,因为可用的位置字段,如用户位置和tweets的位置名并不可靠。用户的精确GPS定位在推特上很少见,有时在时空信息上也会出错。”

受自然灾害或其他紧急情况影响的人们经常在社交媒体上分享他们的位置,寻求帮助。这些信息可以帮助反应单位和地方当局及早发现事件,找到受害者并帮助他们。然而,从tweet中提取与位置相关的数据是一项非常具有挑战性的任务,因为这些数据通常是用非标准英语编写的,并且包含语法错误、拼写错误或缩写。

辛格说:“人工跟踪每条推文并找到其中提到的位置信息几乎是不可能的。”“这促使大家开发一种解决方案,自动从请求帮助的tweet中提取位置信息。在这项工作中,大家利用深度学习来确定一条推文是否包含位置名,并突出显示这些词。”

Singh和他的同事Abhivan Kumar开发了一个CNN模型,可以通过分析用户的推文内容来识别用户的位置。他们选择了这种特定的深度学习方法,因为它可以自动学习输入数据的最佳表示,并使用它来识别位置引用。

辛格说明说:“大家使用了一种文字嵌入技术来表示CNN输入层的推文,推文中的位置引用在输出层以0 - 1向量的形式表示。”“位置词编码为1,非位置词编码为0。大家使用了2克、3克、4克和5克过滤器的几种组合来提取tweet的特征。经过100个时代的模型训练,它能够以令人印象深刻的准确性预测推文中提到的位置参考。”

在最初的评估中,Singh和Kumar设计的CNN模型能够以非常高的准确率从tweet中提取出所有与位置相关的单词,即使tweet的文本是有噪声的。研究人员测试了他们的模型,这些模型没有经过预处理,包含语法错误、拼写错误、缩写和其他混淆因素。

“大家工作的主要实际意义是,它可以很容易地使用事件检测模型进行流水线操作,”Singh说。“事件检测模型可以识别与灾难相关的推文,而大家的模型可以提取受灾难影响的受害者的位置。”

在未来,研究人员开发的CNN模型可以帮助快速定位紧急事件和需要紧急援助的人。同样的方法也可以应用于社会动乱、定向广告、观察区域人类行为、实时道路交通管理和其他基于位置的服务。

辛格说:“在这项研究中,大家只考虑了英文推文,但在危机期间,用户也会用他们当地的语言发布推文。”“因此,大家正在研究一个模型,解决这种多语言限制,同时也试图开发一个半监督模型,以减少数据标签的问题。”

慎重声明:本文版权归原编辑所有,转载文章仅为传播更多信息之目的,如编辑信息标记有误,请第一时间联系大家修改或删除,多谢。

上一篇:济南高新区英语口语单词学习方法

下一篇:没有了

XML 地图 | Sitemap 地图