登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書

『簡體書』自然语言理解与行业知识图谱:概念、方法与工程落地

書城自編碼: 3714978
分類:簡體書→大陸圖書→計算機/網絡人工智能
作者: 王楠,赵宏宇,蔡月
國際書號(ISBN): 9787111698302
出版社: 机械工业出版社
出版日期: 2022-01-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 148.8

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
异域回声——晚近海外汉学之文史互动研究
《 异域回声——晚近海外汉学之文史互动研究 》

售價:HK$ 109.8
世界文明中的作物迁徙:聚焦亚洲、中东和南美洲被忽视的本土农业文明
《 世界文明中的作物迁徙:聚焦亚洲、中东和南美洲被忽视的本土农业文明 》

售價:HK$ 99.7
无端欢喜
《 无端欢喜 》

售價:HK$ 76.2
股票大作手操盘术
《 股票大作手操盘术 》

售價:HK$ 53.8
何以中国·何谓唐代:东欧亚帝国的兴亡与转型
《 何以中国·何谓唐代:东欧亚帝国的兴亡与转型 》

售價:HK$ 87.4
一间只属于自己的房间 女性主义先锋伍尔夫代表作 女性精神独立与经济独立的象征,做自己,比任何事都更重要
《 一间只属于自己的房间 女性主义先锋伍尔夫代表作 女性精神独立与经济独立的象征,做自己,比任何事都更重要 》

售價:HK$ 44.6
泉舆日志 幻想世界宝石生物图鉴
《 泉舆日志 幻想世界宝石生物图鉴 》

售價:HK$ 134.2
养育女孩 : 官方升级版
《 养育女孩 : 官方升级版 》

售價:HK$ 50.4

 

建議一齊購買:

+

HK$ 122.5
《数字化与智能化车间》
+

HK$ 72.6
《人工智能基础 数学知识》
+

HK$ 99.8
《用Python动手学统计学》
+

HK$ 107.4
《智能网联汽车自动驾驶仿真技术》
+

HK$ 186.3
《机器人SLAM导航:核心技术与实战》
+

HK$ 73.1
《智能革命》
內容簡介:
首先阐述自然语言理解的发展脉络和分析逻辑,主要围绕语言符号、处理体系、语义理解等进行探讨,引出自然语言理解的自动分析原理和方法,包括对自然语言特征、统计语言学习、常规机器学习、深度学习、知识图谱方面的介绍。在上述基本自然语言处理方法讲解基础上,继续阐述行业知识图谱搭建和行业应用的方法。通过作者团队几年来在自然语言处理和行业知识图谱的实践经验,探讨垂直行业认知的逻辑和解决方案。本书为互联网企业的文本智能平台构建的提供了很好的案例参考,也为行业信息化从业者提供了从入门到进阶的一整套技术指导,同时也适合作为自然语言处理、知识图谱、计算机、人工智能等领域从业者的学习指导书,若是对自然语言处理、知识图谱、人工智能感兴趣的学生、创业团队,本书也非常适宜阅读。
目錄
推荐序一推荐序二前言符号表第1章 自然语言之“理解”11.1 基本脉络51.1.1 文字传承61.1.2 机器处理81.1.3 理解困境91.2 商业曙光101.3 认知落脚点121.3.1 文本分析之锚131.3.2 走向智能之路141.3.3 步在何方141.4 思辨未来141.4.1 语言理解与语义知识的辨析141.4.2 行业知识图谱构建问题15小结15参考文献16第2章 自然语言理解逻辑172.1 符号-连接-融合172.2 语言理解任务182.2.1 语法类任务202.2.2 语义类任务262.2.3 语用类任务342.3 语言理解体系42小结43参考文献44第3章 自然语言处理453.1 自然语言文本特征463.1.1 通用语言文本特征463.1.2 行业语言文本特征473.1.3 语言文本特征表示483.1.4 语言特征选择493.2 自然语言统计学习543.2.1 统计学习基础543.2.2 语言语料库653.2.3 语料采样663.2.4 语言模型673.3 自然语言机器学习693.3.1 文本分类方法693.3.2 文本标注方法843.3.3 文本聚类方法903.3.4 文本生成方法953.3.5 文本匹配方法973.3.6 图计算方法1043.4 自然语言深度学习1143.4.1 神经网络学习1153.4.2 神经网络结构1183.4.3 深度表示学习1363.4.4 预训练语言模型1393.4.5 前沿与思考148小结149参考文献149第4章 知识图谱1504.1 语言知识与语言知识库1504.2 知识图谱演进1524.3 知识图谱工程1534.3.1 知识表示1544.3.2 知识加工1584.3.3 知识建模与计算1664.3.4 知识存储与查询1684.3.5 知识更新1704.4 知识图谱智能1714.4.1 语义匹配1714.4.2 搜索推荐1724.4.3 问答对话1744.4.4 推理决策1754.4.5 区块链协作1764.5 通用知识图谱1774.5.1 百科知识图谱1774.5.2 常识知识图谱1794.5.3 中文类知识图谱1804.6 行业知识图谱1814.6.1 金融知识图谱1824.6.2 医疗知识图谱1864.6.3 教育知识图谱1894.6.4 公安知识图谱1914.6.5 司法知识图谱1934.6.6 电商生活知识图谱1944.6.7 图书文献知识图谱1964.6.8 房地产知识图谱198小结199第5章 行业知识工程实践2015.1 行业知识库2025.1.1 行业语料库2035.1.2 行业术语知识库2065.1.3 行业文本规则库2165.1.4 行业特征字段库2195.1.5 行业本体库2205.1.6 行业附图库2255.1.7 行业产品库2275.1.8 行业标准库2305.1.9 应用知识库2325.2 行业模型算法库2335.2.1 文本匹配2335.2.2 文本分类2375.2.3 文本标注2485.2.4 文本生成2555.2.5 关联图计算2605.2.6 价值评估2615.3 标注、训练和更新2645.3.1 标注工具2645.3.2 训练框架2675.3.3 知识更新269小结269第6章 行业知识图谱模块2716.1 关键词助手2736.1.1 术语图谱2746.1.2 产品图谱2776.2 搜索问答2786.2.1 语义搜索2796.2.2 功能搜索2816.2.3 事实型问答2836.3 推理计算284小结288第7章 行业智能应用平台2897.1 平台架构初探2897.1.1 硬件拓扑架构2907.1.2 平台系统架构2907.1.3 功能服务架构2937.2 平台认知功能组件2937.2.1 文本检索2937.2.2 文本分析2987.2.3 文本挖掘3067.2.4 监控预警3117.2.5 价值运营3127.2.6 信息流管理3137.3 权限与安全管理3147.3.1 架构与流程3157.3.2 平台用户管理3167.3.3 安全管理318小结318第8章 行业文本智能应用3208.1 高价值文本发现3208.1.1 高价值文本定义3208.1.2 高价值文本评价3218.1.3 价值发现与价值运营3218.2 成果分级分类管理3228.2.1 成果分级3238.2.2 成果分类3238.3 新兴方向预测3248.4 技术背景调查326小结328附录A 概率论基础330附录B 信息论基础339
內容試閱
21世纪以来人类创造了海量的自然语言文本数据,但苦于没有“语言媒介大师”,即使拥有共同母语的双方也可能出现“语言隔离”,更不要说人机自然交互了。人类日常接触的语言可以分为通用语言和专业语言:通用语言往往口语化严重,语法杂乱,信息量不足;专业语言需要结合行业知识,有特定的文法,个性化突出。语言特征复杂多变,语种语义理解差异化明显,如何自动化、智能化地理解语言成为各行各业的痛点。自然语言理解应运而生!通过对人类语言信息的抽取、归纳、总结,自然语言理解成为重要的人工智能成果的检验标准之一,被业内人士称为人工智能皇冠上的明珠。当然路要一步步走,语言的理解首先要解决语言处理问题。伴随海量用户数据(互联网数据、行业业务数据、百科和领域知识)、人工智能算法、集成AI芯片的规模算力平台不断涌入,自然语言处理领域已经树立了一座座里程碑。从早期的符号学派专家系统,到统计语言学习的兴起,再到Word2vec预训练语言模型将语义工具应用落地,各种深度学习框架(TensorFlow、Torch、Paddle Paddle)不断更新……我们似乎摸到了认知的大门。2018年,随着谷歌BERT预训练语言模型横空出世,语言理解领域也开启了“ImageNet”时代篇章。紧接着,XLNet、ERNIE、GPT-3等新模型,以及注意力机制、Transformer、图神经网络等新结构层出不穷,不断刷新各大任务榜单的记录(state-of-the-art,SOTA),推动了整个语言理解水平的持续发展。当然,上述自然语言处理还需要语义知识的配合,基于语义知识搭建的知识图谱就成为行业应用的关键一环。知识图谱是在知识工程和语义网的基础上发展起来的,2012年谷歌正式提出了“知识图谱”一词,随后知识图谱逐渐成为互联网公司的底层基础设施之一。通用知识图谱主要有DBpedia、Freebase、YAGO、Wikidata等百科知识库。在吸收了WordNet、FrameNet、Hownet等语言知识精华后,ConceptNet、Concept Graph等常识知识图谱也不断涌现,为语言理解奠定了背景知识基础。随着知识图谱、多模态数据的引入,知识蒸馏和模型压缩进一步推动了语言处理和语义理解的应用步伐。目前,市面上已经常见面向C端用户的智能音箱、智能导航、智能客服、聊天机器人、机器翻译工具等产品,一些SaaS平台也处于初级体验阶段,这印证了自然语言理解行业的广阔发展空间。自然语言理解当然不止于日常应用,它已逐渐向各行各业赋能,推动语言理解成果向行业转移、转化。面向B端的各垂直行业(例如金融、医疗、公安、电商等)及细分领域逐渐有相应的图谱产品落地。但是到目前为止,语言理解服务多体现为项目合作、平台调用、服务赋能,其工业落地效果面临更多的需求挑战。一方面供求双方在业务理解方面差距巨大,另一方面沟通合作也由于存在信息交互隔阂,这些都严重制约自然语言理解项目或产品落地。如何围绕行业需求,仍然需要结合行业知识构建知识图谱,将自然语言处理与知识图谱更好地融合,才能直击垂直行业落地应用的痛点。站在自然语言理解需求爆发和落地困境的十字路口,我们该如何看待自然语言理解的优势与不足,如何更好地推动自然语言理解在垂直行业的应用落地呢?这正是本书想要重点探讨的目标。随着国家对人工智能、知识产权等行业的日益重视,我们将进入产业互联网和创新驱动的全新时代!创新需要保护和激励,创新知识需要挖掘和利用,而这些知识正沉积在以专利为代表的知识产权文本中,目前全球已经有超过1.2亿篇专利文本,等待知识图谱赋能。从这个行业视角进入,我们似乎可以揭开行业落地之谜。本书通过对自然语言理解的思考和各类算法模型的阐述,结合对知识图谱的认知,讲解作者团队几年来在自然语言处理和行业知识图谱方向的实践经验,旨在抛砖引玉。本书即将付梓之时,一个新的生命也将诞生,谨以此书献给我们即将出生的宝贝。这本书将始终是草稿的状态,如果有人问何时成稿,我们想说下一版!因为这个主题“Never-End Learning”。现在,我们仅期待本书可以帮助大家打开那扇大门,初步体验自然语言理解的行业落地之道。本书主要内容本书主要内容结构如下图所示,分为两部分,共8章。自然语言理解部分包含第1~4章。本部分首先阐述自然语言理解的发展脉络和理解逻辑,主要围绕语言符号、处理体系、语义理解等进行探讨,引出自然语言理解的自动分析原理和方法,包括自然语言特征、统计学习、机器学习、深度学习、知识图谱等。第1章概述自然语言发展脉络,描述了语言理解的研究现状、商业形势、认知突破口和未来预测。第2章梳理语言理解的演变流程,介绍我们面临的各类自然语言理解任务,后给出语言理解的研究体系框架,引出自然语言理解的基础—自然语言处理。第3章重点介绍自然语言处理相关特征工程和文本任务对应的各类算法模型、深度学习的前沿进展。语言处理需要考虑特征构造(字、词、句、章级别)和特征表示,以利于后续自动处理。在特征表示方面,从早的符号表示到现在的张量表示,形成统计学习的基础。接下来结合统计学习框架,论述语言学习原理和语言模型,结合概率图模型和其他机器学习算法,阐述这些常规算法在自然语言处理任务中的应用和效果。然后进一步讨论深度学习的各类算法,对语言学习中的神经网络算法和成果进行分析。后探讨现有处理方法的发展边界,提出引入外源知识(知识图谱)来提高认知能力的必要性。第4章系统介绍知识图谱,包括知识图谱工程和知识图谱智能。然后梳理国内外常见的通用知识图谱,并进一步总结热门行业的知识图谱发展现状。后结合语言知识和知识图谱的搭建流程,引入语义特征,通过行业文本实例操作,帮助读者了解语义理解的本质。行业知识图谱部分包含第5~8章。本部分在上述基本自然语言处理方法讲解的基础上,继续阐述行业知识图谱搭建和行业应用的方法。目前从事自然语言理解的公司都将精力放在通用文本理解上,这些文本往往口语化严重、特征杂乱、信息量不足,导致算法处理形成的终产品的用户体验不佳。考虑到行业文本往往有一定规范,相对容易取得突破口,也有利于推动行业发展,所以我们选择从行业文本出发,以专利文本实操作为样板。第5章介绍行业知识工程实践,以专利行业为例,详细地描述了一个行业知识工程建设的过程。首先基于自然语言处理和知识图谱搭建方法,建设行业知识库,包括术语库、产品库、技术库、标准库、规则库等,进而开发行业主题分析模型、行业文本分类算法、相似度计算方法、价值评估方法和机器翻译方法。第6章介绍知识图谱模块的搭建,包括关键词助手、语义搜索、分级管理、高级分析、推荐和问答等。结合实际应用,探讨知识图谱在提高智能性方面的能力和效果。第7章在前面知识工程和知识图谱智能基础上搭建智能应用平台,介绍了平台的各类功能组件,描述了自下而上的软件服务封装逻辑,进一步向上封装为行业文本分析功能组件,包括检索、分析、挖掘、管理、预警、运营等。读者可以将这套思路在各行业进行实践验证,将上述组件和权限、安全板块集成为应用平台,搭建常态化文本分析运营平台,完成平台级别或各细分模块的商业产品落地。第8章依托智能应用平台,结合实践案例给出团队的应用经验,即通过四个行业案例来验证平台的认知能力。本书的目标读者本书以自然语言理解和行业知识图谱应用落地为目标,阐述了一个从0到1的行业文本理解案例。本书为互联网企业的智能平台构建提供了很好的案例参考,也为行业信息化从业者提供了从入门到进阶的技术指导,适合作为自然语言处理、知识图谱、计算机、人工智能等领域从业者的学习指导书,也非常适合对自然语言处理、知识图谱感兴趣的学生和创业团队阅读。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.