会员   密码 您忘记密码了吗?
1,501,862 本书已上架      购物流程 | 常见问题 | 联系我们 | 关于我们 | 用户协议

有店 App


当前分类

浏览历史

当前位置: 首页 > 电脑资讯 > 资料库/大数据 > 文本探勘:小技術大應用(附範例光碟)
文本探勘:小技術大應用(附範例光碟)
上一张
文本探勘:小技術大應用(附範例光碟)
下一张
prev next

文本探勘:小技術大應用(附範例光碟)

作者: 許健將,劉福蒝
出版社: 全華圖書
出版日期: 2020-10-27
商品库存: 点击查询库存
以上库存为海外库存属流动性。
可选择“空运”或“海运”配送,空运费每件商品是RM14。
配送时间:空运约8~12个工作天,海运约30个工作天。
(以上预计配送时间不包括出版社库存不足需调货及尚未出版的新品)
定价:   NT350.00
市场价格: RM53.24
本店售价: RM47.38
促销价: RM45.25
剩余时间: 请稍等, 正在载入中...
购买数量:
collect Add to cart Add booking
详细介绍 商品属性 商品标记
內容簡介

  動輒十萬字、甚至數十萬字的小說,其中人物錯綜複雜的關係、心境轉折與環境的變遷;廣大的網路訊息與文件,其中有多少潛藏的訊息等待我們發掘。文本探勘,就是要在大量文字中萃取出我們所需要的資訊。
 
  本書之撰寫,是針對完全不具備R語言能力之初學者為主要對象,以手把手的方式進行教學,讀者只要跟隨書本的章節和範例,一步一步地練習,相信必能在最短的時間內學會文本探勘的基本技術,並應用在自身所屬的領域上。包括語料庫的建立與相關套件的使用;利用文本探勘對中、英文小說進行各種分析;以及利用文本探勘進行網路爬蟲。全書由淺入深、按部就班地指導讀者學會文本探勘技術,進而能從各類非結構化的文字當中擷取有用的資訊,以做為後續進行下決定(decision-making)或形成政策(policy-making)之用。
 
本書特色
 
  1. 利用R語言的文本探勘能力做中、英文小說的情感分析。
  2. 利用R語言進行網路爬蟲,在非結構化的文字中擷取資訊。
  3. 學習上列的技術後,能從各類非結構化的文字中擷取有用的資訊,以利未來決定與決策之用。


目錄

Chapter 1 - R語言的下載與安裝
1.1 R語言
1.2 RStudio
1.3 R語言的套件

Chapter 2 - 學習文字探勘前的R基礎
2.1 變數
2.2 資料型態與資料結構
2.3 缺失值
2.4 管線運算子
2.5 正規表達式(Regular expression)
2.6 基本字符串函數
2.7 stringr套件
2.8 資料的讀取與匯出
2.9 建立R函數
2.10 條件執行
2.11 迴圈
2.12 apply相關函數

Chapter 3 - 文本探勘
3.1 文字探勘的基本概念
3.2 套件介紹
3.3 英文語料庫
3.4 中文語料庫

Chapter 4 - 中、英文小說
4.1 套件介紹
4.2 認識Gutenberg Project
4.3 tidy文本格式
4.4 情感詞庫
4.5 英文小說分析 - Little Women
4.6 英文小說 - n元語法
4.7 中文小說分析 - 三國演義

Chapter 5 - 網路爬蟲與文字探勘
5.1 網路爬蟲介紹
5.2 靜態擷取網頁
5.3 動態擷取網頁