炼数成金 商业智能自然语言处理
订阅

自然语言处理

自然语言处理:从基础到 RNN 和 LSTM
自然语言处理:从基础到 RNN 和 LSTM
机器学习领域一个最令人着迷的任务,就是训练机器理解人类交流能力的进步。在机器学习领域,这一分支被称为自然语言处理(Natural Language Processing)。本文尝试解释自然语言处理的基础知识,以及随着深度学习和神 ...
智能机器人在滴滴出行场景的技术探索
智能机器人在滴滴出行场景的技术探索
单轮问答指识别用户问题,并给出相应答案。这种场景下的目标是做到识别准确,尽量理解用户问题,给出合适的答案。开发过程中的难点和挑战:数据:标注数据少,这是 NLP 领域的痛点问题,因为标注成本相对较高;业务 ...
特朗普推文的文本分析
特朗普推文的文本分析
通常不会发布关于政治的信息(我对投票不是特别精明,这是数据科学对政治产生最大影响的地方),但本周末我看到了一个关于唐纳德特朗普的推特账户的假设,这个假设只是被要求调查有数据:当特朗普祝奥运队好运时,他 ...
人工智能聊天机器人:现实与炒作
人工智能聊天机器人:现实与炒作
聊天机器人是机器人与人类进行对话的软件程序。这种对话可以通过文本方法、语音,甚至通过识别人类表达来实现。聊天机器人的互动范围从简单的答案到诸如“外部温度是多少”等问题,以及需要进行一系列对话以获得结果 ...
Bert 之后:预训练语言模型与自然语言生成
Bert 之后:预训练语言模型与自然语言生成
Bert 在自然语言理解领域获得了巨大的成功,但是在自然语言生成领域却表现不佳,这是由于 Bert 训练时所采用的语言模型所决定的。Bert 这种 DAE 语言模型只学习到了词的上下文表征的能力,即理解语言的能力,但没有 ...
一大批中文(BERT等)预训练模型等你认领!
一大批中文(BERT等)预训练模型等你认领!
预训练模型已经成为了 NLP 领域最重要的资源之一。当我们拿到一个 NLP 数据集时,首要任务是寻找一个预训练模型。当然,目前大家会趋同的选择 Google 发布的 BERT 模型 。预训练模型一般分成四个部分:语料、编码器 ...
细思极恐!只需54块钱,你也能让AI伪造一系列联合国发言
细思极恐!只需54块钱,你也能让AI伪造一系列联合国发言
联合国发言生成器了解一下?最近,有研究人员真就搞出了一个。手握这个生成器,你就可以无限生成逼真的联合国演讲风格的内容。快速传递假新闻、随口就能生成仇恨言论、冒充知名人物进行演讲……这个模型让人细思极恐 ...
20项任务横扫BERT!CMU谷歌发布XLNet,NLP再迎屠榜时刻
20项任务横扫BERT!CMU谷歌发布XLNet,NLP再迎屠榜时刻
这世界变化快。去年10月,Google团队发布BERT模型横扫一切,在11种不同NLP测试中创出最佳成绩。现在,轮到BERT被碾压了。CMU和Google Brain团队最新发布的XLNet,在20项任务上超过了BERT的表现,包括SQuAD、GLUE、RA ...
中文自然语言处理数据集:ChineseNLPCorpus
中文自然语言处理数据集:ChineseNLPCorpus
推荐一个Github项目:ChineseNLPCorpus,该项目收集了一批中文自然语言处理数据集的相关链接。中文自然语言处理数据集,平时做做实验的材料。欢迎补充提交合并。
哈工大讯飞联合实验室发布基于全词覆盖的中文BERT预训练模型
哈工大讯飞联合实验室发布基于全词覆盖的中文BERT预训练模型
基于Transformers的双向编码表示(BERT)在多个自然语言处理任务中取得了广泛的性能提升。近期,谷歌发布了基于全词覆盖(Whold Word Masking)的BERT预训练模型,并且在SQuAD数据中取得了更好的结果。应用该技术后 ...
一步步理解BERT
一步步理解BERT
NLP:自然语言处理(NLP)是信息时代最重要的技术之一。理解复杂的语言也是人工智能的重要组成部分。而自google在2018年10月底公布BERT在11项nlp任务中的卓越表后,BERT(Bidirectional Encoder Representation from ...
HFL技术分享 #16 | 基于流的生成模型
HFL技术分享 #16 | 基于流的生成模型
生成模型(Generative Model)与判别模型(Discriminative Model)是机器学习模型里的两大家族。判别模型常常用来做回归、分类的任务;而生成模型是一个数据模拟器,可以做数据采样与生成相关的任务。例如,时下非常 ...
HFL技术分享 #15 | 短文本分类及相关技术
HFL技术分享 #15 | 短文本分类及相关技术
文本分类作为文本理解的基本任务、能够服务于大量应用(如文本摘要、情感分析、推荐系统等等),更是长期以来学术界与工业界关注的焦点。 先前的方式主要采取人设定特征(词袋、词性标注、树核等)或者ML/DNN对文本 ...
HFL技术分享#14 | Reinforcement Learning Applications for NLP
HFL技术分享#14 | Reinforcement Learning Applications for NLP
强化学习(RL)是机器学习的一个分支,是介于监督学习和非监督学习之间的,从经验中学习的方法。由于强化学习在机器控制、游戏等领域获得了瞩目的研究成果,学者们开始尝试将RL与自然语言处理相结合,希望解决传统方 ...
HFL技术分享 #13 | 自动文摘相关技术简介
HFL技术分享 #13 | 自动文摘相关技术简介
随着互联网的飞速发展以及数据呈现爆炸式的增长,人们迫切需要一种技术能够从大量、嘈杂的数据中提取关键信息,这种“大量、嘈杂”的数据不仅包含文本,同时也可以是图像、视频、语音等各种模态的数据,自动摘要(Au ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2019-8-7 01:25 , Processed in 0。133976 second(s), 16 queries 。

    内蒙古快三开奖结果 江西快三开奖结果 江苏快三开奖结果 贵州快3开奖结果 甘肃快3开奖结果 江西快三开奖结果 江苏快三开奖结果 甘肃快3开奖结果 吉林快3开奖结果 极速快三开奖结果