English Japanese Korean Thai Traditional Chinese 简体中文
Publish Now
Publish Books Publish Media Products My Store Self Publish
Gold Log In Cart
Category
Browse all kinds of eBooks, magazines, videos by category
    More services
    • All You Can Read

    • Channels

    • Hot topics

    Language
    English Japanese Korean Thai Traditional Chinese 简体中文
    Back
    Category
    • Home

    • Books

    • Pubook E-Ink reader

    • Magazines

    • Media

    • Newspapers

    • Adult

    Back
    Books
    • All

    • Free to read

    • Finance

      Finance
      • All

      • Management

      • Investing

      • Marketing

    • Literature/Fiction

      Literature/Fiction
      • All

      • LGBTQ

      • Literature

      • Fiction

      • Romantic Fiction

    • Leisure Life

      Leisure Life
      • All

      • Recreation

      • Illustrated Book

      • Fortune Telling

      • Travel

      • Eating Habits

      • Fitness

    • Humanities

      Humanities
      • All

      • History/Geography

      • Law

      • Politics/Military

      • Applied Sciences

      • Natural Sciences

      • Philosophy

      • Biographies

      • Sociology

    • News/Entertainment

    • Language/Computers

      Language/Computers
      • All

      • Computers/Technology

      • Language

    • Religion/Spirituality

      Religion/Spirituality
      • All

      • Motivational

      • Health/Nutrition

      • Christianity

      • Buddhism

      • Taoism

      • Islam

      • Other Religions

      • Relationships

    • Mangas

      Mangas
      • All

      • Comics

      • Illustrations

      • Fan Works

      • Romance Mangas for Teens

      • Teenage Mangas

      • High School Mangas

      • Romance Mangas

      • Yaoi Mangas

      • GL Mangas

      • TL Mangas

      • Gay Mangas

      • Others

    • Art/Design

      Art/Design
      • All

      • Performance Art

      • Art

      • Design

      • Photography

    • Parenting/Relationships

      Parenting/Relationships
      • All

      • Education

      • Kids/Teenagers

      • Pregnancy/Childbirth

    • Exams

      Exams
      • All

      • Study

      • Government Exams

      • Financial Licenses

      • Teacher Exams

      • Professional Exams

      • TOEFL/TOEIC

      • Learning Skills

      • Official Publications

      • Job Hunting Exams

    • Photo Books

      Photo Books
      • All

      • Female Photo Books

      • Male Photo Books

    Back
    Magazines
    • All

    • Free to read

    • Finance

      Finance
      • All

      • Business Management

      • Investing

      • Direct Marketing

      • Advertising

      • Law

    • News/Entertainment

      News/Entertainment
      • All

      • News Analysis

      • General News

      • Stars

    • Leisure Life

      Leisure Life
      • All

      • Travel

      • Hobby

      • Family Life

      • Fitness

    • Art/Design

      Art/Design
      • All

      • Design

      • Art Appreciation

      • Decoration

      • Photography

    • Literature/Spirituality

      Literature/Spirituality
      • All

      • Literature

      • Christianity

      • Buddhism

    • Male Fashion

      Male Fashion
      • All

      • Fashion

    • Female Fashion

      Female Fashion
      • All

      • Urban Fashion

      • Teen Fashion

    • Car/Audio

      Car/Audio
      • All

      • Music/Audio

      • Cars/Motorbikes

    • Sports

      Sports
      • All

      • Basketball

      • Baseball

      • Outdoor Sports

    • Language/Computers

      Language/Computers
      • All

      • Computers/Technology

      • Natural Sciences

      • Language

    • Parenting/Relationships

      Parenting/Relationships
      • All

      • Pregnancy/Childbirth

      • Education

      • Books for Kids

      • Books for Teenagers

    • Photo Books

      Photo Books
      • All

      • Female Photo Books

      • Male Photo Books

    Back
    Media
    • All

    • Free to read

    • Careers

    • Careers
      • All

    • Investing

    • Investing
      • All

    • Parenting/Relationships

    • Parenting/Relationships
      • All

    • Art/Culture

    • Art/Culture
      • All

    • Religion/Spirituality

    • Religion/Spirituality
      • All

      • Buddhism

      • Christianity

      • Motivational

    • Exams

    • Exams
      • All

      • Government Exams

      • Learning Skills

      • Professional Exams

      • Teacher Exams

      • Study

      • Financial Licenses

    • Language

    • Language
      • All

    • Leisure Life

    • Leisure Life
      • All

    • Literature/Fiction

    • Literature/Fiction
      • All

    Back
    Newspapers
    • All

    • 工商時報

    • 中國時報

    • 旺報

    • 联合日報

    • 光華日報

    Back
    Adult
    • Free to read

    • Gay

    • Nude male

    • Lesbian

    • Nude female

    • Adult Manga

    Finance
    • All

    • Management

    • Investing

    • Marketing

    Literature/Fiction
    • All

    • LGBTQ

    • Literature

    • Fiction

    • Romantic Fiction

    Leisure Life
    • All

    • Recreation

    • Illustrated Book

    • Fortune Telling

    • Travel

    • Eating Habits

    • Fitness

    Humanities
    • All

    • History/Geography

    • Law

    • Politics/Military

    • Applied Sciences

    • Natural Sciences

    • Philosophy

    • Biographies

    • Sociology

    News/Entertainment
    • All

    Language/Computers
    • All

    • Computers/Technology

    • Language

    Religion/Spirituality
    • All

    • Motivational

    • Health/Nutrition

    • Christianity

    • Buddhism

    • Taoism

    • Islam

    • Other Religions

    • Relationships

    Mangas
    • All

    • Comics

    • Illustrations

    • Fan Works

    • Romance Mangas for Teens

    • Teenage Mangas

    • High School Mangas

    • Romance Mangas

    • Yaoi Mangas

    • GL Mangas

    • TL Mangas

    • Gay Mangas

    • Others

    Art/Design
    • All

    • Performance Art

    • Art

    • Design

    • Photography

    Parenting/Relationships
    • All

    • Education

    • Kids/Teenagers

    • Pregnancy/Childbirth

    Exams
    • All

    • Study

    • Government Exams

    • Financial Licenses

    • Teacher Exams

    • Professional Exams

    • TOEFL/TOEIC

    • Learning Skills

    • Official Publications

    • Job Hunting Exams

    Photo Books
    • All

    • Female Photo Books

    • Male Photo Books

    Back
    Finance
    • All

    • Business Management

    • Investing

    • Direct Marketing

    • Advertising

    • Law

    Back
    News/Entertainment
    • All

    • News Analysis

    • General News

    • Stars

    Back
    Leisure Life
    • All

    • Travel

    • Hobby

    • Family Life

    • Fitness

    Back
    Art/Design
    • All

    • Design

    • Art Appreciation

    • Decoration

    • Photography

    Back
    Literature/Spirituality
    • All

    • Literature

    • Christianity

    • Buddhism

    Back
    Male Fashion
    • All

    • Fashion

    Back
    Female Fashion
    • All

    • Urban Fashion

    • Teen Fashion

    Back
    Car/Audio
    • All

    • Music/Audio

    • Cars/Motorbikes

    Back
    Sports
    • All

    • Basketball

    • Baseball

    • Outdoor Sports

    Back
    Language/Computers
    • All

    • Computers/Technology

    • Natural Sciences

    • Language

    Back
    Parenting/Relationships
    • All

    • Pregnancy/Childbirth

    • Education

    • Books for Kids

    • Books for Teenagers

    Back
    Photo Books
    • All

    • Female Photo Books

    • Male Photo Books

    Back
    Channels
    • 今周刊

    • 飽讀商周

    • 經理人

    • 大師輕鬆讀

    • 普洛達康

    • 禾馬

    • 台灣武俠傳說

    You haven't completed email verification, please complete email verification to purchase DRM Free or magazine subscription products
    You haven't completed phone verification, please complete phone verification to enable publishing features
    You haven't completed email verification, please complete email verification to enable publishing features
    • Home

    • Favorite

    • Account

    • Gold

    • Library

    More
    1. Home
    2. Books
    3. Language/Computers
    4. Computers/Technology
    5. JavaScript 爬蟲新思路!從零開始帶你用 Node.js 打造 FB&IG 爬蟲專案
    (iT邦幫忙鐵人賽系列書)

    JavaScript 爬蟲新思路!從零開始帶你用 Node.js 打造 FB&IG 爬蟲專案

    Author 林鼎淵(Dean Lin)
    Publisher 博碩文化
    Follow Save Saved Share
    Released
    2021/07/25
    Language
    Traditional Chinese
    File format
    PDF (41MB), fit in large screen and Pubook
    Pages
    416
    ID
    254779
    ISBN
    9789864348886
    Provide Adobe DRM
    Provide PDF
    Offer DRM free license
    No
    Series iT邦幫忙鐵人賽系列書

    Buy products firstAnd download app to watch

    Details
    (iT邦幫忙鐵人賽系列書)

    JavaScript 爬蟲新思路!從零開始帶你用 Node.js 打造 FB &IG 爬蟲專案(iT邦幫忙鐵人賽系列書)

    Author 林鼎淵(Dean Lin)
    Publisher 博碩文化
    Share
    Released
    2021/08/02
    Language
    Traditional Chinese
    Pages
    416
    ID
    555100
    ISBN
    9789864348008
    DRM
    NT$460
    紙本書
    NT$558
    Explanation
    eBook
    Printed book
    Standard NT$620
    Get NT$69 off
    查看適用禮券
    Buy

    Preview View

    Buy for others
    庫存 0
    • Intro

    • Chapters

    • Author

    本書內容改編自第12屆 iT 邦幫忙鐵人賽,AI&Data 組佳作網路系列文章──
    《行銷廣告、電商小編的武器,FB & IG 爬蟲專案從零開始 》

     你知道 JavaScript 不僅能寫網頁還能夠爬蟲嗎?
     你受夠像機器人般蒐集資料的生活嗎?
     從新手村畢業的朋友想知道一個專案是如何進行的嗎?
     PM 們想知道工程師面對問題時在想什麼嗎?

     想知道這些答案嗎?想知道的話可以全部都給你。
     閱讀吧!我把所有的解答都放在書裡了!

    【書籍特色】

    ✪從零開始!手把手建置 Mac/Windows 的專案環境

    擋住學習熱情的不是困難的工具,而是屢戰屢敗的環境建置!
    除了 step by step 帶你安裝環境,更讓你掌握每個工具的用途與原理。

    ✪循序漸進!每個章節都是一個里程碑

    每個章節都有明確的學習目標,讓讀者在閱讀與實作的過程中成長;
    並透過實務上的議題,培養獨立思考能力。

    ✪整合技術!完成屬於自己的爬蟲專案

    從架構上全面著手,提供多種解決問題的思路,打造擴充性強大的系統。
    透過需求訪談,你將發現──只有爬蟲技術是無法完善整個專案的!
    儲存資料的容器、定時執行的排程與爬蟲完成後的通知都是不可或缺的一環。
    Node.js x Selenium x Google Sheets x Schedule x LINE Notify

    最後,習得爬蟲技能的你

     1. 向機械化的操作 Say Goodbye ~
     2. 蒐集海量資料不再是苦差事
     3. 比別人擁有更多技能優勢
    More
    More
    PART 1 先了解專案需求,再思考如何實作
    01 需求訪談
    02 撰寫需求規格書
    PART 2 開發前環境介紹&設定
    03 開發前環境介紹&設定
    PART 3 寫程式所需的基礎常識(Node.js)
    04 寫程式時該注意的基本原則
    05 認識Node.js專案
    06 用Yarn安裝及控管套件
    07 善用「.env」管理環境變數,幫你快速遷移專案
    08 在「.gitignore」設定不加入版控的資料
    PART 4 用selenium-webdriver爬蟲網頁資訊
    09 爬蟲之前
    10 認識selenium-webdriver,操作所見即所得的爬蟲工具
    11 爬蟲第一步,FB先登入
    12 關閉干擾爬蟲的彈窗,取得FB粉專追蹤數
    13 舉一反三,帶你了解IG爬蟲不可忽略的細節
    14 合體吧!用一隻程式搞定FB、IG爬蟲
    15 重構程式碼,減少歷史業障
    16 用try-catch捕獲爬蟲過程發生的錯誤
    17 json x爬蟲=瑣事自動化
    18 驗證json的內容是否符合格式
    19 優化爬蟲的小技巧
    20 學會爬蟲,之後呢?
    PART 5 使用Google Sheets儲存爬蟲資訊
    21 免費儲存資料的好選擇,一起進入省錢起手式
    22 了解官方範例在做什麼事
    23 你在文件迷路了嗎?用兩個處理Sheet的範例帶你攻略官方文件
    24 寫入爬蟲資料,告別Copy & Paste的日子
    25 客戶:「爬蟲資料塞錯位置!」專案被報Bug的處理方式
    26 客戶:「我希望新資料插在最前面!」如何談需求變更
    27 優化格式,滿足客戶需求 & 談使用者體驗
    PART 6 設定排程自動執行爬蟲程式
    28 用Schedule套件讓爬蟲自己動起來
    29 用 pm2套件來控管Node.js排程,背景執行才是王道!
    30 今天爬蟲怎麼沒有跑?來試試系統內建的排程吧!
    PART 7 透過LINE回報爬蟲狀況
    31 透過POSTMAN了解LINE Notify如何使用
    32 用axios發出LINE通知
    33 整合LINE的爬蟲通知,專案大功告成!
    More
    林鼎淵(Dean Lin)

    待過專業的接案公司、也有獨立接案的經驗,這本書教的是從談需求到真實商業環境的程式開發,可以讓讀者接地氣的學習。

    筆者擁有5年的全端開發經驗,熟悉 Vuetify、Node.js、Laravel 等前後端技術;同時也兼職公司內部伺服器管理與 Gitlab 架設部署等相關任務。

    除了精進工作上的技術外,也會研究新的技術領域;在2019年出於對魔術的愛好, 學習並運用 React Native 開發了能在行動裝置 Android/iOS 運行的魔術 APP。

    在空閒時會與朋友交流 idea,碰上有趣的想法就會研究相關技術並將其寫成 Side Project,像本書的爬蟲技術就是為了幫朋友解決工作遇到的困擾而研究的。

    不僅對技術充滿熱情,更會將自身的經驗分享到部落格上,希望可以幫助遇到相同問題的人:
    https://medium.com/dean-lin
    More
    • Intro

    • Chapters

    • Author


    本書內容改編自第12屆 iT 邦幫忙鐵人賽,AI&Data 組佳作網路系列文章──

    《行銷廣告、電商小編的武器,FB & IG 爬蟲專案從零開始 》



    你知道 JavaScript 不僅能寫網頁還能夠爬蟲嗎?

    你受夠像機器人般蒐集資料的生活嗎?

    從新手村畢業的朋友想知道一個專案是如何進行的嗎?

    PM 們想知道工程師面對問題時在想什麼嗎?



    想知道這些答案嗎?想知道的話可以全部都給你。

    閱讀吧!我把所有的解答都放在書裡了!



    書籍特色



    從零開始!手把手建置 Mac/Windows 的專案環境



    擋住學習熱情的不是困難的工具,而是屢戰屢敗的環境建置!

    除了 step by step 帶你安裝環境,更讓你掌握每個工具的用途與原理。



    循序漸進!每個章節都是一個里程碑



    每個章節都有明確的學習目標,讓讀者在閱讀與實作的過程中成長;

    並透過實務上的議題,培養獨立思考能力。



    整合技術!完成屬於自己的爬蟲專案



    從架構上全面著手,提供多種解決問題的思路,打造擴充性強大的系統。

    透過需求訪談,你將發現──只有爬蟲技術是無法完善整個專案的!

    儲存資料的容器、定時執行的排程與爬蟲完成後的通知都是不可或缺的一環。

    Node.js x Selenium x Google Sheets x Schedule x LINE Notify



    最後,習得爬蟲技能的你



    1. 向機械化的操作 Say Goodbye ~

    2. 蒐集海量資料不再是苦差事

    3. 比別人擁有更多技能優勢



    本書線上資源:

    github.com/dean9703111/social_crawler


    More
    More


    PART 1 先了解專案需求,再思考如何實作



    01 需求訪談

    1.1 傾聽客戶的需求

    1.2 向客戶推薦解決問題的方法



    02 撰寫需求規格書

    2.1 專案分析

    2.2 需求規格

    2.3 新手接案的注意事項

    2.4 如何避免接案後無法完成功能交付的困境



    PART 2 開發前環境介紹& 設定



    03 開發前環境介紹&設定

    3.1 Node.js

    3.2 nvm

    3.3 Git

    3.4 Yarn

    3.5 VSCode



    PART 3 寫程式所需的基礎常識(Node.js)



    04 寫程式時該注意的基本原則

    4.1 正確的宣告變數

    4.2 有意義的命名

    4.3 避免重複的程式碼

    4.4 避免寫出大眾難以理解的程式

    4.5 好的註解

    4.6 錯誤處理 & 日誌(log)



    05 認識 Node.js 專案

    5.1 建立 Node.js 程式

    5.2 執行 Node.js

    5.3 認識專案管家:「package.json」

    5.4 善用 scripts (腳本)執行程式

    5.5 使用 license 保護自己的權益

    5.6 取得筆者專案原始碼



    06 用 Yarn 安裝及控管套件

    6.1 套件對工程師的幫助

    6.2 如何找出適合的套件

    6.3 安裝套件,觀察安裝後目錄結構的變化

    6.4 控制套件版本範圍

    6.5 下關鍵字找工具的方法



    07 善用「.env」管理環境變數,幫你快速遷移專案

    7.1 為什麼專案需要環境變數?

    7.2 環境變數的使用時機

    7.3 分析專案中哪些參數適合當環境變數

    7.4 學會使用環境變數



    08 在「.gitignore」設定不加入版控的資料

    8.1 慘痛經驗分享

    8.2 哪些檔案/ 資料夾不需要放入版控?

    8.3 在專案加入「.gitignore」

    8.4 透過 VSCode 確認是否成功將檔案加入忽略清單

    8.5 為環境變數建立一個可以上傳的範例檔



    PART 4 用 selenium-webdriver 爬蟲網頁資訊



    09 爬蟲之前

    9.1 學習爬蟲對我有什麼好處?

    9.2 爬蟲前請注意這些事情避免違法

    9.3 選擇符合需求的爬蟲工具



    10 認識 selenium-webdriver,操作所見即所得的爬蟲工具

    10.1 安裝 selenium-webdriver 套件 & 環境

    10.2 使用 selenium-webdriver 套件開啟瀏覽器

    10.3 解決 Windows 無法讀取 chromedriver.exe 的問題

    10.4 解決 Windows 開啟瀏覽器時跳出 USB: usb_device_handle_win.cc 的錯誤



    11 爬蟲第一步,FB 先登入

    11.1 學會分析網頁結構 - 以 FB 登入頁為範例

    11.2 打造自動登入 FB 的小程式

    11.3 專案原始碼 & 執行程式



    12 關閉干擾爬蟲的彈窗,取得 FB 粉專追蹤數

    12.1 關閉通知彈窗

    12.2 將大目標拆解成小目標,以前往 FB 粉專取得追蹤人數資訊為例

    12.3 前往 FB 粉專

    12.4 分析 FB 粉專頁面結構

    12.5 取得 FB 粉專追蹤人數

    12.6 完成爬蟲後關閉瀏覽器

    12.7 專案原始碼 & 執行程式



    13 舉一反三,帶你了解 IG 爬蟲不可忽略的細節

    13.1 分析 IG 登入畫面元件

    13.2 使用 css 抓取元件,完成 IG 自動登入

    13.3 分析畫面判斷使用者是否登入成功

    13.4 了解響應式網頁對爬蟲的影響

    13.5 設定瀏覽器開啟時的視窗大小

    13.6 前往 IG 帳號並取得追蹤人數

    13.7 專案原始碼 & 執行程式



    14 合體吧!用一隻程式搞定 FB、IG 爬蟲

    14.1 瀏覽器關閉時機錯誤導致爬蟲中斷

    14.2 跨網域(CORS)錯誤

    14.3 一隻程式爬完 FB & IG 粉專

    14.4 思考程式上有什麼地方需要改進

    14.5 專案原始碼 & 執行程式



    15 重構程式碼,減少歷史業障

    15.1 主程式做了太多事情

    15.2 一個函式做了太多事情

    15.3 物件宣告的方式太複雜且多次被使用

    15.4 專案原始碼 & 執行程式



    16 用try-catch 捕獲爬蟲過程發生的錯誤

    16.1 了解 try-catch-finally 的語法

    16.2 思考專案中有哪些地方需要加上 try-catch 的機制

    16.3 try-catch 設計時要注意的重點

    16.4 加入 preCheck.js 做為第一道防線

    16.5 在專案的 crawlerIG.js 加入 try-catch

    16.6 將等待時間設定為變數

    16.7 專案原始碼 & 執行程式



    17 json x 爬蟲 = 瑣事自動化

    17.1 客戶要將爬蟲的網址列表填到什麼檔案呢?

    17.2 了解 json 格式與基本規則

    17.3 在專案中加入 json 格式的粉專清單

    17.4 在 JavaScript 檔引入 json 檔案

    17.5 撰寫批量爬蟲程式

    17.6 專案原始碼 & 執行程式



    18 驗證 json 的內容是否符合格式

    18.1 為什麼 json 在使用前要先驗證格式?

    18.2 認識驗證 json 格式的套件:「jsonschema」

    18.3 測試 jsonschema 的範例程式

    18.4 用 jsonschema 來驗證 json 粉專清單

    18.5 將驗證的程式統整為函式:「jsonValidator」

    18.6 專案原始碼 & 執行程式



    19 優化爬蟲的小技巧

    19.1 思考優化的方向

    19.2 優化爬蟲執行效率及穩定度

    19.3 讓爬蟲在背景執行

    19.4 偽裝瀏覽器的 user-agent

    19.5 將優化的起動條件設定到「.env」

    19.6 專案原始碼 & 執行程式



    20 學會爬蟲,之後呢?

    20.1 感覺爬蟲技術還沒學夠

    20.2 我還是想不到爬蟲可以用來做什麼



    PART 5 使用 Google Sheets 儲存爬蟲資訊



    21 免費儲存資料的好選擇,一起進入省錢起手式

    21.1 取得 Google Sheets 憑證(credentials)

    21.2 在專案加入官方提供的範例程式做測試

    21.3 將 Google Sheets 的憑證、授權檔加入「.gitignore」

    21.4 專案原始碼



    22 了解官方範例在做什麼事

    22.1 套件不是照著官方文件安裝就沒事了

    22.2 分析官方範例程式

    22.3 取得「spreadsheetId」,並加入「.env」

    22.4 撰寫讀取指定 Google Sheets 的函式

    22.5 專案原始碼 & 執行程式



    23 你在文件迷路了嗎?用兩個處理 Sheet 的範例帶你攻略官方文件

    23.1 拆asnd

    PART 1 先了解專案需求,再思考如何實作

    01 需求訪談
    1.1 傾聽客戶的需求
    1.2 向客戶推薦解決問題的方法

    02 撰寫需求規格書
    2.1 專案分析
    2.2 需求規格
    2.3 新手接案的注意事項
    2.4 如何避免接案後無法完成功能交付的困境

    PART 2 開發前環境介紹& 設定

    03 開發前環境介紹&設定
    3.1 Node.js
    3.2 nvm
    3.3 Git
    3.4 Yarn
    3.5 VSCode

    PART 3 寫程式所需的基礎常識(Node.js)

    04 寫程式時該注意的基本原則
    4.1 正確的宣告變數
    4.2 有意義的命名
    4.3 避免重複的程式碼
    4.4 避免寫出大眾難以理解的程式
    4.5 好的註解
    4.6 錯誤處理 & 日誌(log)

    05 認識 Node.js 專案
    5.1 建立 Node.js 程式
    5.2 執行 Node.js
    5.3 認識專案管家:「package.json」
    5.4 善用 scripts (腳本)執行程式
    5.5 使用 license 保護自己的權益
    5.6 取得筆者專案原始碼

    06 用 Yarn 安裝及控管套件
    6.1 套件對工程師的幫助
    6.2 如何找出適合的套件
    6.3 安裝套件,觀察安裝後目錄結構的變化
    6.4 控制套件版本範圍
    6.5 下關鍵字找工具的方法

    07 善用「.env」管理環境變數,幫你快速遷移專案
    7.1 為什麼專案需要環境變數?
    7.2 環境變數的使用時機
    7.3 分析專案中哪些參數適合當環境變數
    7.4 學會使用環境變數

    08 在「.gitignore」設定不加入版控的資料
    8.1 慘痛經驗分享
    8.2 哪些檔案/ 資料夾不需要放入版控?
    8.3 在專案加入「.gitignore」
    8.4 透過 VSCode 確認是否成功將檔案加入忽略清單
    8.5 為環境變數建立一個可以上傳的範例檔

    PART 4 用 selenium-webdriver 爬蟲網頁資訊

    09 爬蟲之前
    9.1 學習爬蟲對我有什麼好處?
    9.2 爬蟲前請注意這些事情避免違法
    9.3 選擇符合需求的爬蟲工具

    10 認識 selenium-webdriver,操作所見即所得的爬蟲工具
    10.1 安裝 selenium-webdriver 套件 & 環境
    10.2 使用 selenium-webdriver 套件開啟瀏覽器
    10.3 解決 Windows 無法讀取 chromedriver.exe 的問題
    10.4 解決 Windows 開啟瀏覽器時跳出 USB: usb_device_handle_win.cc 的錯誤

    11 爬蟲第一步,FB 先登入
    11.1 學會分析網頁結構 - 以 FB 登入頁為範例
    11.2 打造自動登入 FB 的小程式
    11.3 專案原始碼 & 執行程式

    12 關閉干擾爬蟲的彈窗,取得 FB 粉專追蹤數
    12.1 關閉通知彈窗
    12.2 將大目標拆解成小目標,以前往 FB 粉專取得追蹤人數資訊為例
    12.3 前往 FB 粉專
    12.4 分析 FB 粉專頁面結構
    12.5 取得 FB 粉專追蹤人數
    12.6 完成爬蟲後關閉瀏覽器
    12.7 專案原始碼 & 執行程式

    13 舉一反三,帶你了解 IG 爬蟲不可忽略的細節
    13.1 分析 IG 登入畫面元件
    13.2 使用 css 抓取元件,完成 IG 自動登入
    13.3 分析畫面判斷使用者是否登入成功
    13.4 了解響應式網頁對爬蟲的影響
    13.5 設定瀏覽器開啟時的視窗大小
    13.6 前往 IG 帳號並取得追蹤人數
    13.7 專案原始碼 & 執行程式

    14 合體吧!用一隻程式搞定 FB、IG 爬蟲
    14.1 瀏覽器關閉時機錯誤導致爬蟲中斷
    14.2 跨網域(CORS)錯誤
    14.3 一隻程式爬完 FB & IG 粉專
    14.4 思考程式上有什麼地方需要改進
    14.5 專案原始碼 & 執行程式

    15 重構程式碼,減少歷史業障
    15.1 主程式做了太多事情
    15.2 一個函式做了太多事情
    15.3 物件宣告的方式太複雜且多次被使用
    15.4 專案原始碼 & 執行程式

    16 用try-catch 捕獲爬蟲過程發生的錯誤
    16.1 了解 try-catch-finally 的語法
    16.2 思考專案中有哪些地方需要加上 try-catch 的機制
    16.3 try-catch 設計時要注意的重點
    16.4 加入 preCheck.js 做為第一道防線
    16.5 在專案的 crawlerIG.js 加入 try-catch
    16.6 將等待時間設定為變數
    16.7 專案原始碼 & 執行程式

    17 json x 爬蟲 = 瑣事自動化
    17.1 客戶要將爬蟲的網址列表填到什麼檔案呢?
    17.2 了解 json 格式與基本規則
    17.3 在專案中加入 json 格式的粉專清單
    17.4 在 JavaScript 檔引入 json 檔案
    17.5 撰寫批量爬蟲程式
    17.6 專案原始碼 & 執行程式

    18 驗證 json 的內容是否符合格式
    18.1 為什麼 json 在使用前要先驗證格式?
    18.2 認識驗證 json 格式的套件:「jsonschema」
    18.3 測試 jsonschema 的範例程式
    18.4 用 jsonschema 來驗證 json 粉專清單
    18.5 將驗證的程式統整為函式:「jsonValidator」
    18.6 專案原始碼 & 執行程式

    19 優化爬蟲的小技巧
    19.1 思考優化的方向
    19.2 優化爬蟲執行效率及穩定度
    19.3 讓爬蟲在背景執行
    19.4 偽裝瀏覽器的 user-agent
    19.5 將優化的起動條件設定到「.env」
    19.6 專案原始碼 & 執行程式

    20 學會爬蟲,之後呢?
    20.1 感覺爬蟲技術還沒學夠
    20.2 我還是想不到爬蟲可以用來做什麼

    PART 5 使用 Google Sheets 儲存爬蟲資訊

    21 免費儲存資料的好選擇,一起進入省錢起手式
    21.1 取得 Google Sheets 憑證(credentials)
    21.2 在專案加入官方提供的範例程式做測試
    21.3 將 Google Sheets 的憑證、授權檔加入「.gitignore」
    21.4 專案原始碼

    22 了解官方範例在做什麼事
    22.1 套件不是照著官方文件安裝就沒事了
    22.2 分析官方範例程式
    22.3 取得「spreadsheetId」,並加入「.env」
    22.4 撰寫讀取指定 Google Sheets 的函式
    22.5 專案原始碼 & 執行程式

    23 你在文件迷路了嗎?用兩個處理 Sheet 的範例帶你攻略官方文件
    23.1 拆askw


    PART 1 先了解專案需求,再思考如何實作



    01 需求訪談

    1.1 傾聽客戶的需求

    1.2 向客戶推薦解決問題的方法



    02 撰寫需求規格書

    2.1 專案分析

    2.2 需求規格

    2.3 新手接案的注意事項

    2.4 如何避免接案後無法完成功能交付的困境



    PART 2 開發前環境介紹& 設定



    03 開發前環境介紹&設定

    3.1 Node.js

    3.2 nvm

    3.3 Git

    3.4 Yarn

    3.5 VSCode



    PART 3 寫程式所需的基礎常識(Node.js)



    04 寫程式時該注意的基本原則

    4.1 正確的宣告變數

    4.2 有意義的命名

    4.3 避免重複的程式碼

    4.4 避免寫出大眾難以理解的程式

    4.5 好的註解

    4.6 錯誤處理 & 日誌(log)



    05 認識 Node.js 專案

    5.1 建立 Node.js 程式

    5.2 執行 Node.js

    5.3 認識專案管家:「package.json」

    5.4 善用 scripts (腳本)執行程式

    5.5 使用 license 保護自己的權益

    5.6 取得筆者專案原始碼



    06 用 Yarn 安裝及控管套件

    6.1 套件對工程師的幫助

    6.2 如何找出適合的套件

    6.3 安裝套件,觀察安裝後目錄結構的變化

    6.4 控制套件版本範圍

    6.5 下關鍵字找工具的方法



    07 善用「.env」管理環境變數,幫你快速遷移專案

    7.1 為什麼專案需要環境變數?

    7.2 環境變數的使用時機

    7.3 分析專案中哪些參數適合當環境變數

    7.4 學會使用環境變數



    08 在「.gitignore」設定不加入版控的資料

    8.1 慘痛經驗分享

    8.2 哪些檔案/ 資料夾不需要放入版控?

    8.3 在專案加入「.gitignore」

    8.4 透過 VSCode 確認是否成功將檔案加入忽略清單

    8.5 為環境變數建立一個可以上傳的範例檔



    PART 4 用 selenium-webdriver 爬蟲網頁資訊



    09 爬蟲之前

    9.1 學習爬蟲對我有什麼好處?

    9.2 爬蟲前請注意這些事情避免違法

    9.3 選擇符合需求的爬蟲工具



    10 認識 selenium-webdriver,操作所見即所得的爬蟲工具

    10.1 安裝 selenium-webdriver 套件 & 環境

    10.2 使用 selenium-webdriver 套件開啟瀏覽器

    10.3 解決 Windows 無法讀取 chromedriver.exe 的問題

    10.4 解決 Windows 開啟瀏覽器時跳出 USB: usb_device_handle_win.cc 的錯誤



    11 爬蟲第一步,FB 先登入

    11.1 學會分析網頁結構 - 以 FB 登入頁為範例

    11.2 打造自動登入 FB 的小程式

    11.3 專案原始碼 & 執行程式



    12 關閉干擾爬蟲的彈窗,取得 FB 粉專追蹤數

    12.1 關閉通知彈窗

    12.2 將大目標拆解成小目標,以前往 FB 粉專取得追蹤人數資訊為例

    12.3 前往 FB 粉專

    12.4 分析 FB 粉專頁面結構

    12.5 取得 FB 粉專追蹤人數

    12.6 完成爬蟲後關閉瀏覽器

    12.7 專案原始碼 & 執行程式



    13 舉一反三,帶你了解 IG 爬蟲不可忽略的細節

    13.1 分析 IG 登入畫面元件

    13.2 使用 css 抓取元件,完成 IG 自動登入

    13.3 分析畫面判斷使用者是否登入成功

    13.4 了解響應式網頁對爬蟲的影響

    13.5 設定瀏覽器開啟時的視窗大小

    13.6 前往 IG 帳號並取得追蹤人數

    13.7 專案原始碼 & 執行程式



    14 合體吧!用一隻程式搞定 FB、IG 爬蟲

    14.1 瀏覽器關閉時機錯誤導致爬蟲中斷

    14.2 跨網域(CORS)錯誤

    14.3 一隻程式爬完 FB & IG 粉專

    14.4 思考程式上有什麼地方需要改進

    14.5 專案原始碼 & 執行程式



    15 重構程式碼,減少歷史業障

    15.1 主程式做了太多事情

    15.2 一個函式做了太多事情

    15.3 物件宣告的方式太複雜且多次被使用

    15.4 專案原始碼 & 執行程式



    16 用try-catch 捕獲爬蟲過程發生的錯誤

    16.1 了解 try-catch-finally 的語法

    16.2 思考專案中有哪些地方需要加上 try-catch 的機制

    16.3 try-catch 設計時要注意的重點

    16.4 加入 preCheck.js 做為第一道防線

    16.5 在專案的 crawlerIG.js 加入 try-catch

    16.6 將等待時間設定為變數

    16.7 專案原始碼 & 執行程式



    17 json x 爬蟲 = 瑣事自動化

    17.1 客戶要將爬蟲的網址列表填到什麼檔案呢?

    17.2 了解 json 格式與基本規則

    17.3 在專案中加入 json 格式的粉專清單

    17.4 在 JavaScript 檔引入 json 檔案

    17.5 撰寫批量爬蟲程式

    17.6 專案原始碼 & 執行程式



    18 驗證 json 的內容是否符合格式

    18.1 為什麼 json 在使用前要先驗證格式?

    18.2 認識驗證 json 格式的套件:「jsonschema」

    18.3 測試 jsonschema 的範例程式

    18.4 用 jsonschema 來驗證 json 粉專清單

    18.5 將驗證的程式統整為函式:「jsonValidator」

    18.6 專案原始碼 & 執行程式



    19 優化爬蟲的小技巧

    19.1 思考優化的方向

    19.2 優化爬蟲執行效率及穩定度

    19.3 讓爬蟲在背景執行

    19.4 偽裝瀏覽器的 user-agent

    19.5 將優化的起動條件設定到「.env」

    19.6 專案原始碼 & 執行程式



    20 學會爬蟲,之後呢?

    20.1 感覺爬蟲技術還沒學夠

    20.2 我還是想不到爬蟲可以用來做什麼



    PART 5 使用 Google Sheets 儲存爬蟲資訊



    21 免費儲存資料的好選擇,一起進入省錢起手式

    21.1 取得 Google Sheets 憑證(credentials)

    21.2 在專案加入官方提供的範例程式做測試

    21.3 將 Google Sheets 的憑證、授權檔加入「.gitignore」

    21.4 專案原始碼



    22 了解官方範例在做什麼事

    22.1 套件不是照著官方文件安裝就沒事了

    22.2 分析官方範例程式

    22.3 取得「spreadsheetId」,並加入「.env」

    22.4 撰寫讀取指定 Google Sheets 的函式

    22.5 專案原始碼 & 執行程式



    23 你在文件迷路了嗎?用兩個處理 Sheet 的範例帶你攻略官方文件

    23.1 拆

    More


    林鼎淵(Dean Lin)



    待過專業的接案公司、也有獨立接案的經驗,這本書教的是從談需求到真實商業環境的程式開發,可以讓讀者接地氣的學習。



    筆者擁有5年的全端開發經驗,熟悉 Vuetify、Node.js、Laravel 等前後端技術;同時也兼職公司內部伺服器管理與 Gitlab 架設部署等相關任務。



    除了精進工作上的技術外,也會研究新的技術領域;在2019年出於對魔術的愛好, 學習並運用 React Native 開發了能在行動裝置 Android/iOS 運行的魔術 APP。



    在空閒時會與朋友交流 idea,碰上有趣的想法就會研究相關技術並將其寫成 Side Project,像本書的爬蟲技術就是為了幫朋友解決工作遇到的困擾而研究的。



    不僅對技術充滿熱情,更會將自身的經驗分享到部落格上,希望可以幫助遇到相同問題的人:

    medium.com/dean-lin


    More

    Details

    Released
    2021/07/25
    Language
    Traditional Chinese
    File format
    PDF: Fit in large screen
    Provide Adobe DRM
    Provide PDF
    Offer DRM free license
    No
    ID
    254779
    ISBN
    9789864348886
    Released
    2021/08/02
    Language
    Traditional Chinese
    Pages
    416
    ID
    555100
    ISBN
    9789864348008

    網路爬蟲

    JavaScript

    Buy products firstAnd download app to watch

    Details

    See more 博碩文化

    More

    一本書讀懂DeepSeek:AI巨頭競爭的新變數

    Word 論文寫作全攻略:Copilot智慧引導,助你輕鬆掌握論文排版技巧

    你的第一本Git與GitHub入門書:輕鬆實作本機與遠端儲存庫的版本控制

    圖解人體生理學:一看就懂的身體運作奧秘

    AI×Excel×Tableau資料分析語法指南

    一個人的藍隊:企業資安防護技術實戰指南(iThome鐵人賽系列書)

    AI + ESP32-CAM + AWS:物聯網與雲端運算的專題實作應用

    星鏈崛起:探索6G時代的天空戰場

    超實用AI技能工具箱:提升職場.教育與生活的275個高效應用技巧

    Android應用程式開發全方位實作指南:邁向專業工程師的養成之路

    See more 博碩文化

    More

    一本書讀懂DeepSeek:AI巨頭競爭的新變數

    Word 論文寫作全攻略:Copilot智慧引導,助你輕鬆掌握論文排版技巧

    你的第一本Git與GitHub入門書:輕鬆實作本機與遠端儲存庫的版本控制

    圖解人體生理學:一看就懂的身體運作奧秘

    AI×Excel×Tableau資料分析語法指南

    一個人的藍隊:企業資安防護技術實戰指南(iThome鐵人賽系列書)

    AI + ESP32-CAM + AWS:物聯網與雲端運算的專題實作應用

    星鏈崛起:探索6G時代的天空戰場

    超實用AI技能工具箱:提升職場.教育與生活的275個高效應用技巧

    Android應用程式開發全方位實作指南:邁向專業工程師的養成之路

    Related Product

    Python x Excel VBA x JavaScript|網路爬蟲 x 實戰演練

    PHP網路爬蟲開發:入門到進階的爬蟲技術指南(iT邦幫忙鐵人賽系列書)

    使用Python搜刮網路資料的12堂實習課

    文科生也可以輕鬆學習網路爬蟲:Python+Web Scraper

    Python 從網路爬蟲到生活應用超實務:人工智慧世代必備的資料擷取術

    Python 網路爬蟲與資料分析入門實戰

    Python網頁程式交易APP實作:Web + MySQL + Django(第二版)

    文科生也可以輕鬆學會Web Scraper網路爬蟲與Power Automate X Excel大數據分析

    爬蟲在手 資料我有:7堂課學會高效率Scrapy爬蟲(iT邦幫忙鐵人賽系列書)

    隔壁鄰居是爬友 (2)

    Python網路爬蟲:大數據擷取、清洗、儲存與分析-王者歸來

    AI世代必備!Python×ChatGPT高效率工作術:從網路爬蟲到辦公室自動化超實務

      

    Review

    0 ratings
    1 stars
    0%
    2 stars
    0%
    3 stars
    0%
    4 stars
    0%
    5 stars
    0%
    Write a review
    Eligible to write reviews after purchasing products or add to Library
    Explanation
    DRM needs to login with Pubu Web or App, DRM free can be opened with any device or App
    You already owned this product
    Are you sure you want to buy JavaScript 爬蟲新思路!從零開始帶你用 Node.js 打造 FB&IG 爬蟲專案 again? This will generate duplicated items in your Library
    Buy again
    Buy for others
    After completing the checkout process, go to "Profile, Manage gift codes" to send the gift code to your friends or group members
    Quantity
    OK
    English Japanese Korean Thai Traditional Chinese 简体中文

    • About Pubu

    • Terms of Service

    • Privacy policy

    • Publish Books

    • Publish Media Products

    • Self Publish

    • Support

    • Join AP Alliance

    • 用台灣之星看飽讀

    • Redeem Retail Products

    Free downloaddddddddddddd
    Free download
    Payment
    About Pubu
    湛天創新科技股份有限公司
    24488585
    Copyright © Nuazure Innovative Technology Co., Ltd. & HK Renascimedia Co., Ltd.
    pubu-web-3.9.0.202009251127
    Download Android APK
    Download

    系統訊息


    您的合約條件不符合推廣聯盟申請資格,如有疑問請洽詢Pubu版權部窗口

    系統訊息


    您必須啟用賣家功能,才能透過專屬推廣連結,賣書賺回饋金
    Choose language
    English 日本語 한국어 ไทย 繁體中文 简体中文
    Processing