關(guān)于我們
書單推薦
新書推薦
|
Python地理空間數(shù)據(jù)分析 本書介紹了為什么發(fā)現(xiàn)并量化數(shù)據(jù)模式對(duì)空間數(shù)據(jù)分析非常重要。你將學(xué)會(huì):在數(shù)據(jù)問題中應(yīng)用空間關(guān)系。使用柵格和矢量圖。使用開源工具和公共數(shù)據(jù)集為地圖增加信息量。使用 Python 腳本自動(dòng)化處理地理數(shù)據(jù)。理解空間數(shù)據(jù)科學(xué)的圖形化表現(xiàn)形式,激發(fā)好奇心。 編輯推薦 前言本書是關(guān)于如何做地理空間數(shù)據(jù)分析的入門指南,書中采用的Python 庫(kù)和包都針對(duì)數(shù)據(jù)的探索和挖掘做了優(yōu)化。近年來,隨著物聯(lián)網(wǎng)的出現(xiàn),以及位置數(shù)據(jù)在本地計(jì)算機(jī)上的普及,包括地理空間專家、數(shù)據(jù)科學(xué)家、商業(yè)分析師、地理學(xué)家、地質(zhì)學(xué)家、研究人員、分析師、計(jì)算機(jī)科學(xué)家和統(tǒng)計(jì)專家等不同領(lǐng)域的專業(yè)人員都在使用帶有內(nèi)置分析功能的地理信息平臺(tái)。他們?cè)谔剿鲗W(xué)習(xí)的過程中,往往希望對(duì)日常使用的分析工具底層所采用的技術(shù)有更深入的了解。圖形化用戶界面的分析工具固然強(qiáng)大,但通過自己編寫Python 代碼來完全定制化或自動(dòng)化分析結(jié)果,不但能提升你的核心技能,也有助于更好地掌握大型平臺(tái)和系統(tǒng)的運(yùn)作原理。開源項(xiàng)目已經(jīng)無處不在,如今,大多數(shù)行業(yè)的專業(yè)人士可以獲得各種定位數(shù)據(jù)和公開的數(shù)據(jù)集。隨著云計(jì)算的發(fā)展,我們不再需要將大量數(shù)據(jù)下載到本地計(jì)算機(jī),這就意味著,任何擁有互聯(lián)網(wǎng)設(shè)備的人都有同等的機(jī)會(huì)獲取數(shù)據(jù)。本書旨在成為能滿足業(yè)內(nèi)人士需求的資源庫(kù),無論他們身處哪一領(lǐng)域,本書都將成為他們實(shí)現(xiàn)目標(biāo)和達(dá)成愿望的指南。我們也鼓勵(lì)各種背景的讀者參與地理空間數(shù)據(jù)分析,為城市規(guī)劃、氣候變化研究等各個(gè)領(lǐng)域的決策提供支持信息。即使是對(duì)于有經(jīng)驗(yàn)的數(shù)據(jù)分析師, 技術(shù)往往也有其固有的難度。如果你熟悉Python,會(huì)調(diào)用QGIS 或者ArcGIS 等類庫(kù),在現(xiàn)成的數(shù)據(jù)系統(tǒng)上工作,那么即使你不了解其背后運(yùn)作的工作流,不理解柵格、向量、數(shù)學(xué)模型等概念,也可以完成工作。但了解這些基礎(chǔ)概念,將有助于你對(duì)數(shù)據(jù)的探索和解釋變得更嚴(yán)謹(jǐn)、更深刻。為什么我要寫這本地理空間數(shù)據(jù)分析與Python 相結(jié)合的書?因?yàn)槲矣龅搅素酱鉀Q的問題。我在分析電子健康記錄時(shí)發(fā)現(xiàn),這些記錄中包含了大量的醫(yī)療數(shù)據(jù),但可用的人口統(tǒng)計(jì)信息卻十分匱乏。而在檢查既有的醫(yī)療保健基礎(chǔ)數(shù)據(jù)時(shí),我發(fā)覺定位數(shù)據(jù)對(duì)預(yù)測(cè)健康結(jié)果有著重要的作用。要制定公共衛(wèi)生政策,我們就必須回答諸如以下這類問題:? 患者所在的社區(qū)周邊,在步行范圍內(nèi)或者便捷的交通沿線上是否有生鮮市場(chǎng)?? 患者所在的社區(qū)是否適合步行,治安狀況怎樣?? 患者是否有參與綠地活動(dòng)的機(jī)會(huì)?? 高速公路、輸電線和廢物處理廠等設(shè)施對(duì)周邊社區(qū)健康有怎樣的影響?? 如何結(jié)合位置數(shù)據(jù)研究這些關(guān)于環(huán)境的問題?將這些類型的非空間數(shù)據(jù)與空間信息相結(jié)合,將有助于制作地圖和其他可視化產(chǎn)物,幫助你思考更復(fù)雜的問題,探索你周圍的環(huán)境,或者地球上你感興趣的其他任何地方。選擇Python 的理由Python 是一種流行的輕量級(jí)腳本語(yǔ)言,因其語(yǔ)法十分直觀,所以比大多數(shù)編程語(yǔ)言更易于學(xué)習(xí),也更能快速上手。而且Python 已經(jīng)和ArcGIS 和QGIS 等地理信息系統(tǒng)(geographic information system,GIS)有所結(jié)合,因此非常適合地理空間數(shù)據(jù)分析。同時(shí),Python 擁有充滿活力的開源社區(qū),有十分豐富的代碼庫(kù)和工具包支持。本書并不是一本Python 入門教材。如果你剛開始接觸Python,需要從基礎(chǔ)開始學(xué)習(xí),在本書之外,有很多更為適合的資源。你可以從Matt Harrison 與Theodore Petrou(Packt Publishing)編寫的《Pandas 1.x Cookbook》(第二版)入手,或者參與一些線下面授或在線的課程,比如Dunder Data 提供的Master the Fundamentals of Python(https://oreil.ly/swed0)。盡管我建議你至少掌握一門編程語(yǔ)言,但你可能沒有系統(tǒng)學(xué)習(xí)的計(jì)劃或時(shí)間,那也沒關(guān)系,本書的目的是讓你掌握并使用公開地理空間數(shù)據(jù)所構(gòu)成的龐大的生態(tài)系統(tǒng),并不要求你具備全面的編程能力。書中提供了代碼片段以及對(duì)應(yīng)的分步指導(dǎo),我還將為你介紹本書未涵蓋的各類外部資源,以便你可以實(shí)踐所學(xué)的知識(shí)。當(dāng)你逐漸熟悉大型庫(kù)或包中的一兩個(gè)函數(shù)后,你一定會(huì)更自信地去探索更加廣闊的領(lǐng)域。本書的組織結(jié)構(gòu)我們將從介紹幾個(gè)關(guān)鍵GIS 概念開始逐步深入,隨著內(nèi)容的推進(jìn),我會(huì)循序漸進(jìn)地引入Python 的學(xué)習(xí),而不是默認(rèn)你具有豐富的編程或地理信息數(shù)據(jù)分析的專業(yè)知識(shí)。本書采用的資源都是開源的,大多數(shù)使用Python 完成,開發(fā)人員免費(fèi)分享這些源代碼,其中有些還包含開源社區(qū)其他成員的貢獻(xiàn)。我會(huì)盡我所能確保本書提供的資源無需繁瑣的訂閱服務(wù)即可使用,所有可能產(chǎn)生的費(fèi)用,無論大小,都會(huì)在本書中明確標(biāo)注,方便你做出決定。我著重強(qiáng)調(diào)開源,也并不意味著我不支持商業(yè)化的解決方案,我只是希望可以盡量減少學(xué)習(xí)中的阻力,集中圍繞重要的問題開展有意義的分析,把好鋼用在刀刃上。本書涉及許多開源工具、數(shù)據(jù)和各種數(shù)據(jù)集,其中一些資源你可能暫時(shí)無法獲取。本書的結(jié)構(gòu)不同于典型的技術(shù)書籍(尤其是針對(duì)Python 的書籍),沒有采用線性組織方式。完成數(shù)據(jù)分析任務(wù)的方法多種多樣,你可能在集成開發(fā)環(huán)境(IDE)中更容易獲得靈感,也可能更喜歡在終端或控制臺(tái)中工作。任何一本書都不可能涵蓋Python 所有包和庫(kù)的每個(gè)細(xì)節(jié),你可能已經(jīng)對(duì)某個(gè)特定的工具或庫(kù)很熟悉,但你最常用的函數(shù)并沒有收錄在本書中,這也無傷大雅,我只希望你能對(duì)這些都有基本的感性認(rèn)識(shí),便于你繼續(xù)深入探索更豐富的功能。本書面向的讀者對(duì)象本書介紹的這個(gè)領(lǐng)域?qū)ξ乙彩且淮翁魬?zhàn):有些Python 程序員剛開始接觸地理空間分析,有些地理空間從業(yè)者剛開始學(xué)習(xí)Python,那么我應(yīng)該如何寫一本能兼顧這兩類讀者需求的書?我決定化繁為簡(jiǎn),從激發(fā)興趣開始。我的目標(biāo)不是在任何一個(gè)領(lǐng)域拓展你的專業(yè)知識(shí),而是讓大家一起專注于學(xué)習(xí)工具的使用和最佳實(shí)踐。在本書結(jié)束時(shí),我希望所有讀者都有足夠的自信,能夠熟練并單獨(dú)進(jìn)行地理信息數(shù)據(jù)分析。為此,在我教授每一種工具和技術(shù)時(shí),希望你能親自動(dòng)手,安裝必要的工具,并使用Jupyter 或Google Colab notebook 運(yùn)行代碼。而且我希望你不僅僅止步于此,我還提供了大量不同的經(jīng)驗(yàn),邀請(qǐng)你繼續(xù)探索。一些關(guān)于工具的技巧世上不存在絕對(duì)可靠的代碼,所以你需要學(xué)習(xí)如何排除代碼故障,而這正是數(shù)據(jù)女神發(fā)明Stack Overflow(https://stackoverflow.com)的原因。但請(qǐng)注意,這些網(wǎng)站提供的答案不一定是最佳的,甚至不一定是對(duì)的,請(qǐng)你仔細(xì)甄別。為了更好地提供幫助,我選擇了有著穩(wěn)定GitHub 來源的Python 包,希望可以獲得更可靠的支持。話雖如此,但我還是有一些建議,希望有助于你安裝以及熟悉本書涉及的工具:? 請(qǐng)盡量創(chuàng)建Python 虛擬環(huán)境,以便你控制Python 版本以及相關(guān)依賴。? 如果你不使用Conda 或Mamba 環(huán)境,請(qǐng)時(shí)刻關(guān)注你使用的Python 和其他軟件或包的版本。代碼錯(cuò)誤最常見的原因就是版本問題。? 不確定你的pip install 是否運(yùn)行成功?請(qǐng)運(yùn)行pip list。所有已經(jīng)安裝的包都會(huì)顯示在會(huì)話窗口的運(yùn)行結(jié)果中。? 不要懼怕閱讀文檔!閱讀教學(xué)材料是重要的學(xué)習(xí)技能,也是排除故障的關(guān)鍵。找到你的學(xué)習(xí)路徑本書前兩章介紹了一些初入地理空間分析領(lǐng)域時(shí)需要了解的基礎(chǔ)概念和技能,在你未來的深入研究中會(huì)用到它們。此后的章節(jié)里,我們將展開介紹具體工具,并通過實(shí)戰(zhàn)操作幫助你熟練運(yùn)用。第3 章介紹QGIS,第4 章介紹Google Earth Engine 和其他云端的分析工具。第5 章介紹OpenStreetMap,第6 章講解ArcGIS Python API,第7 章介紹如何使用GeoPandas 庫(kù)做空間統(tǒng)計(jì)。第8 將暫停介紹工具,開始講解數(shù)據(jù)清洗,學(xué)習(xí)如何從有價(jià)值的數(shù)據(jù)中去除難以避免的噪聲數(shù)據(jù)。之后的第9 章將介紹一個(gè)非常有用的資源:地理空間數(shù)據(jù)抽象庫(kù)(Geospatial Data Abstraction Library,GDAL)。最后,在第10 章中,我們會(huì)通過三個(gè)實(shí)踐項(xiàng)目,將你在本書中所學(xué)的全部?jī)?nèi)容結(jié)合起來,通過研究氣候變化這一緊迫的全球問題,展現(xiàn)你的地理空間數(shù)據(jù)分析能力。在本書末尾,你可以找到大量工具、包和數(shù)據(jù)資源的鏈接,以及本書所使用的資料來源和推薦閱讀的參考資料,幫助你繼續(xù)學(xué)習(xí)之旅。排版約定本書采用以下排版約定。斜體(Italic)表示新術(shù)語(yǔ)、URL、電子郵件地址、文件名和文件擴(kuò)展名。等寬字體(Constant Width)表示程序清單,在段落內(nèi)表示程序元素,例如變量、函數(shù)名稱、數(shù)據(jù)庫(kù)、數(shù)據(jù)類型、環(huán)境變量、語(yǔ)句和關(guān)鍵字。粗體等寬字體(Constant width bold)表示應(yīng)由用戶原封不動(dòng)輸入的命令或其他文本。斜體等寬字體(Constant width italic)表示應(yīng)該替換成用戶提供值的文本,或者由上下文決定的值。使用代碼示例補(bǔ)充材料(代碼示例、練習(xí)等)可從https://github.com/datamongerbonny/geopynotebooks.git 下載。與本書相關(guān)的技術(shù)問題,或者在使用代碼示例上有疑問,請(qǐng)發(fā)電子郵件到errata@oreilly.com.cn。本書是要幫你完成工作的。一般來說,如果本書提供了示例代碼,你可以把它用在你的程序或文檔中。除非你使用了很大一部分代碼,否則無需聯(lián)系我們獲得許可。比如,用本書的幾個(gè)代碼片段寫一個(gè)程序就無需獲得許可,銷售或分發(fā)OReilly 圖書的示例集則需要獲得許可;引用本書中的示例代碼回答問題無需獲得許可,將書中大量的代碼放到你的產(chǎn)品文檔中則需要獲得許可。我們很希望但并不強(qiáng)制要求你在引用本書內(nèi)容時(shí)加上引用說明。引用說明一般包括書名、作者、出版社和ISBN,例如:Python for Geospatial Data Analysis by Bonny P. McClain (OReilly). Copyright 2023 Grapheme Consulting, Inc., 978-0-098-10479-5。如果你覺得自己對(duì)示例代碼的使用超出了上述許可范圍,請(qǐng)通過permissions@oreilly.com 與我們聯(lián)系。OReilly 在線學(xué)習(xí)平臺(tái)(OReilly Online Learning)近40 年來,OReilly Media 致力于提供技術(shù)和商業(yè)培訓(xùn)、知識(shí)和卓越見解,來幫助眾多公司取得成功。公司獨(dú)有的專家和改革創(chuàng)新者網(wǎng)絡(luò)通過OReilly 書籍、文章以及在線學(xué)習(xí)平臺(tái),分享他們的專業(yè)知識(shí)和實(shí)踐經(jīng)驗(yàn)。OReilly 在線學(xué)習(xí)平臺(tái)按照您的需要提供實(shí)時(shí)培訓(xùn)課程、深入學(xué)習(xí)渠道、交互式編程環(huán)境以及來自O(shè)Reilly 和其他200 多家出版商的大量書籍與視頻資料。更多信息,請(qǐng)?jiān)L問網(wǎng)站:https://www.oreilly.com/。聯(lián)系我們?nèi)魏斡嘘P(guān)本書的意見或疑問,請(qǐng)按照以下地址聯(lián)系出版社。美國(guó):OReilly Media, Inc.1005 Gravenstein Highway NorthSebastopol, CA 95472中國(guó):北京市西城區(qū)西直門南大街2 號(hào)成銘大廈C 座807 室(100035)奧萊利技術(shù)咨詢(北京)有限公司勘誤、示例和其他信息可訪問https://oreil.ly/python-for-geo-data 獲取。對(duì)本書的評(píng)論或技術(shù)疑問,可以發(fā)電子郵件到errata@oreilly.com.cn。欲了解本社圖書和課程的新聞和信息,請(qǐng)?jiān)L問我們的網(wǎng)站http://oreilly.com。我們的LinkedIn:https://linkedin.com/company/oreilly-media。我們的Twitter:https://twitter.com/oreillymedia。我們的YouTube:https://youtube.com/oreillymedia。致謝我要感謝眾多地理空間專業(yè)的學(xué)生與學(xué)者,他們?yōu)槲姨峁┝酥笇?dǎo)、建議和疑問,而這些也是成書的動(dòng)力。作為一本既能入門又能為有經(jīng)驗(yàn)者提供指導(dǎo)的書,大家對(duì)此書的熱情讓我倍感自豪。我十分感激田納西大學(xué)諾克斯維爾分校地理系(the Department of Geography atthe University of Tennessee, Knoxville)助理教授吳秋生的大量工作與支持。吳博士對(duì)地理空間社區(qū)的貢獻(xiàn)是無可比擬的,正是他在2021 年GeoPython 研討會(huì)(GeoPython Conference 2021)上有關(guān)GEE 和geemap(https://oreil.ly/X4Pv6)工作坊的演講使我了解到GEE 和Python 集成的重要價(jià)值,一年后我也有幸登上了同樣的研討會(huì)講壇。我還要感謝來自Dunder Data(https://www.dunderdata.com)的Python 和數(shù)據(jù)探索專家Ted Petrou。Ted 提供的實(shí)時(shí)資源和實(shí)惠的工作坊,填補(bǔ)了Python 教學(xué)與工作環(huán)境中的Python 實(shí)踐間的空白。SpatialThoughts(https://oreil.ly/3eJ0c)的Ujaval Gandhi 長(zhǎng)期致力于介紹地理空間平臺(tái)和技巧,無論對(duì)于注冊(cè)學(xué)員還是獨(dú)立學(xué)習(xí)者,他都傾囊相授,我也從他那里獲益良多。還要由衷的感謝GeospatialConnections(https://oreil.ly/SeeNU)社區(qū)的各位版主:Bruce Buxton,Juliana McMillan-Wilhoit,Tim Nolan 和Kendrick Faison。感謝你們無私的幫助,在社區(qū)中與各位同行的交流讓我增長(zhǎng)了不少見識(shí)。感謝我的丈夫Steve,他給予的支持不只是幽默和陪伴,還有沙拉和小熊軟糖。還要感謝我的兩個(gè)兒子Harrison 和Ryland,像北極星一般為我照亮前路,不斷給我智慧、魔力,以及一切的動(dòng)力。 Bonny P. McClain博士是美國(guó)國(guó)家出版俱樂部(National Press Club)、500女性科學(xué)家(500 Women Scientists),以及城市和地區(qū)信息系統(tǒng)協(xié)會(huì)(Urban and Regional Information Systems Association, URISA)的成員,還曾經(jīng)是Tableau 演講局(Tableau Speaker Bureau)和美國(guó)調(diào)查記者編輯協(xié)會(huì)(Investigative Reporters and Editors,IRE)成員,因此有大量機(jī)會(huì)參與衛(wèi)生政策制定和衛(wèi)生經(jīng)濟(jì)學(xué)研討。 目錄
我要評(píng)論
|