秒殺市面 90% 的 Python 入門教程 (上)

板橋胡同37號 2019-10-19

展開全文

選自《王的機器》

作者：王圣元

https://mp.weixin.qq.com/s/c5NEDrTMOm8MjuM67HJ1aQ

昨晚見到大神 Aurélien Géron 真人講 Tensorflow 2.0 的 autograph，會后和他聊天得知他已經(jīng)搬到新加坡了，而且在這邊也有一個 AI consulting 的初創(chuàng)公司。大神非常謙遜，講東西一針見血，現(xiàn)在在忙于他的經(jīng)典書《Hands-On Machine Learning with Scikit-Learn and TensorFlow》的第二版，里面加了很多 Tensorflow 2.0 的新東西。他的書和 youtube 上的幾個視屏都是精品，我自認為寫的最好的文章「膠囊網(wǎng)絡(luò)」是受他的那個 capsule network 的視屏的啟發(fā)而作。

大神的事業(yè)已經(jīng)非常成功，問他寫書的動力在哪 (因為我自己也寫，深知要犧牲很多個人時間)，他很簡單地說他就喜歡一直學(xué)習(xí)，通過寫書可以明晰自己的對知識的理解，通過親自寫代碼可以一直緊跟那些深度學(xué)習(xí)框架的發(fā)展。大神博學(xué)、謙遜、講東西接地氣，值得我學(xué)習(xí)，獻上我和他合照一張 :)

引言

微信公眾號終于可以插代碼了，Python 可以走一波了。首先我承認不是硬核搞 IT 的，太高級的玩法也玩不來，講講下面基本的還可以，之后帶點機器學(xué)習(xí)、金融工程和量化投資的實例也是可以。

這個系列力求精簡和實用 (可能不會完整，但看完此貼舉一反三也不要完整，追求完整的建議去看書)，到了「難點處」我一定會畫圖幫助讀者理解。Python 系列的入門篇的目錄如下，本帖是上篇，只涵蓋前三個節(jié)，下篇接著后兩節(jié)。

對于任何一種計算機語言，我覺得最重要的就是「數(shù)據(jù)類型」「條件語句 & 迭代循環(huán)」和「函數(shù)」，這三方面一定要打牢基礎(chǔ)。此外 Python 非常簡潔，一行代碼 (one-liner) 就能做很多事情，很多時候都用了各種「解析式」，比如列表、字典和集合解析式。

在學(xué)習(xí)本貼前感受一下這個問題：如何把以下這個不規(guī)則的列表 a 里的所有元素一個個寫好，專業(yè)術(shù)語叫打平 (flatten)?

a = [1, 2, [3, 4], [[5, 6], [7, 8]]]

魔法來了 (這一行代碼有些長，用手機的建議橫屏看)

fn = lambda x: [y for l in x for y in fn(l)] if type(x) is list else [x]fn(a)

[1, 2, 3, 4, 5, 6, 7, 8]

這一行代碼，用到了迭代、匿名函數(shù)、遞推函數(shù)、解析式這些技巧。初學(xué)者一看只會說“好酷啊，但看不懂”，看完本帖和下帖后，我保證你會說“我也會這樣用了，真酷！”

基本數(shù)據(jù)類型

Python 里面有自己的內(nèi)置數(shù)據(jù)類型 (build-in data type)，本節(jié)介紹基本的三種，分別是整型 (int)，浮點型 (float)，和布爾型 (bool)。

1.1

整型

整數(shù) (integer) 是最簡單的數(shù)據(jù)類型，和下面浮點數(shù)的區(qū)別就是前者小數(shù)點后沒有值，后者小數(shù)點后有值。例子如下：

a = 1031print( a, type(a) )

1031 <class 'int'>

通過 print 的可看出 a 的值，以及類 (class) 是 int。Python 里面萬物皆對象(object)，「整數(shù)」也不例外，只要是對象，就有相應(yīng)的屬性 (attributes) 和方法 (methods)。

知識點

通過 dir( X ) 和help( X ) 可看出 X 對應(yīng)的對象里可用的屬性和方法。

X 是 int，那么就是 int 的屬性和方法
X 是 float，那么就是 float 的屬性和方法

等等

dir(int)

['__abs__',
 '__add__',
...
 '__xor__',
 'bit_length',
 'conjugate',
...
 'real',
 'to_bytes']

紅色的是 int 對象的可用方法，藍色的是 int 對象的可用屬性。對他們你有個大概印象就可以了，具體怎么用，需要哪些參數(shù) (argument)，你還需要查文檔?？磦€bit_length的例子

a.bit_length()

11

該函數(shù)是找到一個整數(shù)的二進制表示，再返回其長度。在本例中 a = 1031, 其二進制表示為 ‘10000000111’ ，長度為 11。

1.2

浮點型

簡單來說，浮點型 (float) 數(shù)就是實數(shù)，例子如下：

print( 1, type(1) )print( 1., type(1.) )

1 <class 'int'>
1.0 <class 'float'>

加一個小數(shù)點 . 就可以創(chuàng)建 float，不能再簡單。有時候我們想保留浮點型的小數(shù)點后 n 位。可以用 decimal 包里的 Decimal 對象和 getcontext() 方法來實現(xiàn)。

import decimalfrom decimal import Decimal

Python 里面有很多用途廣泛的包 (package)，用什么你就引進 (import) 什么。包也是對象，也可以用上面提到的dir(decimal) 來看其屬性和方法。比如 getcontext() 顯示了 Decimal 對象的默認精度值是 28 位 (prec=28)，展示如下：

decimal.getcontext()

Context(prec=28, rounding=ROUND_HALF_EVEN, Emin=-999999,
Emax=999999, capitals=1, clamp=0, flags=[],
traps=[InvalidOperation, DivisionByZero, Overflow])

讓我們看看 1/3 的保留 28 位長什么樣？

d = Decimal(1) / Decimal(3)d

Decimal('0.3333333333333333333333333333')

那保留 4 位呢？用 getcontext().prec 來調(diào)整精度哦。

decimal.getcontext().prec = 4 e = Decimal(1) / Decimal(3)e

Decimal('0.3333')

高精度的 float 加上低精度的 float，保持了高精度，沒毛病。

d + e

Decimal('0.6666333333333333333333333333')

1.3

布爾型

布爾 (boolean) 型變量只能取兩個值，True 和 False。當(dāng)把布爾變量用在數(shù)字運算中，用 1 和 0 代表 True 和 False。

T = TrueF = Falseprint( T + 2 )print( F - 8 )

3
-8

除了直接給變量賦值 True 和 False，還可以用 bool(X) 來創(chuàng)建變量，其中 X 可以是

基本類型：整型、浮點型、布爾型
容器類型：字符、元組、列表、字典和集合

基本類型

print( type(0), bool(0), bool(1) )print( type(10.31), bool(0.00), bool(10.31) )print( type(True), bool(False), bool(True) )

<class 'int'> False True
<class 'float'> False True
<class 'bool'> False True

bool 作用在基本類型變量的總結(jié)：X 只要不是整型 0、浮點型 0.0，bool(X) 就是 True，其余就是 False。

容器類型

print( type(''), bool( '' ), bool( 'python' ) )print( type(()), bool( () ), bool( (10,) ) )print( type([]), bool( [] ), bool( [1,2] ) )print( type({}), bool( {} ), bool( {'a':1, 'b':2} ) )print( type(set()), bool( set() ), bool( {1,2} ) )

<class 'str'> False True
<class 'tuple'> False True
<class 'list'> False True
<class 'dict'> False True
<class 'set'> False True

bool 作用在容器類型變量的總結(jié)：X 只要不是空的變量，bool(X) 就是 True，其余就是 False。

知識點

確定bool(X) 的值是 True 還是 False，就看 X 是不是空，空的話就是 False，不空的話就是 True。

對于數(shù)值變量，0, 0.0 都可認為是空的。
對于容器變量，里面沒元素就是空的。

此外兩個布爾變量 P 和 Q 的邏輯運算的結(jié)果總結(jié)如下表：

容器數(shù)據(jù)類型

上節(jié)介紹的整型、浮點型和布爾型都可以看成是單獨數(shù)據(jù)，而這些數(shù)據(jù)都可以放在一個容器里得到一個「容器類型」的數(shù)據(jù)，比如：

字符 (str) 是一容器的字節(jié) char，注意 Python 里面沒有 char 類型的數(shù)據(jù)，可以把單字符的 str 當(dāng)做 char。

元組 (tuple)、列表 (list)、字典 (dict) 和集合 (set) 是一容器的任何類型變量。

2.1

字符

字符用于處理文本 (text) 數(shù)據(jù)，用「單引號 ’」和「雙引號 “」來定義都可以。

創(chuàng)建字符

t1 = 'i love Python!'print( t1, type(t1) )t2 = 'I love Python!'print( t2, type(t2) )

i love Python! <class 'str'>
I love Python! <class 'str'>

字符中常見的內(nèi)置方法 (可以用 dir(str) 來查) 有

capitalize()：大寫句首的字母
split()：把句子分成單詞
find(x)：找到給定詞 x 在句中的索引，找不到返回 -1
replace(x, y)：把句中 x 替代成 y
strip(x)：刪除句首或句末含 x 的部分

t1.capitalize()

'I love python!'

t2.split()

['I', 'love', 'Python!']

print( t1.find('love') )print( t1.find('like') )

2
-1

t2.replace( 'love Python', 'hate R' )

'I hate R!'

print( 'http://www.'.strip('htp:/') )print( 'http://www.'.strip('.org') )

www.python.org
http://www.python

索引和切片

s = 'Python'print( s )print( s[2:4] )print( s[-5:-2] )print( s[2] )print( s[-1] )

Python
th
yth
t
n

知識點

Python 里面索引有三個特點 (經(jīng)常讓人困惑)：

從 0 開始 (和 C 一樣)，不像 Matlab 從 1 開始。
切片通常寫成 start:end 這種形式，包括「start 索引」對應(yīng)的元素，不包括「end索引」對應(yīng)的元素。因此 s[2:4] 只獲取字符串第 3 個到第 4 個元素。
索引值可正可負，正索引從 0 開始，從左往右；負索引從 -1 開始，從右往左。使用負數(shù)索引時，會從最后一個元素開始計數(shù)。最后一個元素的位置編號是 -1。

這些特點引起讀者對切片得到什么樣的元素感到困惑。有個小竅門可以幫助大家快速鎖定切片的元素，如下圖。

與其把注意力放在元素對應(yīng)的索引，不如想象將元素分開的隔欄，顯然 6 個元素需要 7 個隔欄，隔欄索引也是從 0 開始，這樣再看到 start:end 就認為是隔欄索引，那么獲取的元素就是「隔欄 start」和「隔欄 end」之間包含的元素。如上圖：

string[2:4] 就是「隔欄 2」和「隔欄 4」之間包含的元素，即 th
string[-5:-2] 就是「隔欄 -5」和「隔欄 -2」之間包含的元素，即 yth

正則表達式

正則表達式 (regular expression) 主要用于識別字符串中符合某種模式的部分，什么叫模式呢？用下面一個具體例子來講解。

input = ''''06/18/2019 13:00:00', 100, '1st';'06/18/2019 13:30:00', 110, '2nd';'06/18/2019 14:00:00', 120, '3rd''''input

'\n'06/18/2019 13:00:00', 100, '1st';
 \n'06/18/2019 13:30:00', 110, '2nd';
 \n'06/18/2019 14:00:00', 120, '3rd'\n'

假如你想把上面字符串中的「時間」的模式來抽象的表示出來，對照著具體表達式 '06/18/2019 13:00:00' 來看，我們發(fā)現(xiàn)該字符串有以下規(guī)則：

開頭和結(jié)束都有個單引號 '
里面有多個 0-9 數(shù)字
里面有多個正斜線 / 和分號 :
還有一個空格

因此我們用下面這樣的模式

pattern = re.compile(''[0-9/:\s]+'')

再看這個抽象模式表達式 '[0-9/:\s]+'，里面符號的意思如下：

最外面的兩個單引號 ' 代表該模式以它們開始和結(jié)束
中括號 [] 用來概括該模式涵蓋的所有類型的字節(jié)
0-9 代表數(shù)字類的字節(jié)
/ 代表正斜線
: 代表分號
\s 代表空格
[] 外面的加號 + 代表 [] 里面的字節(jié)出現(xiàn)至少 1 次

有了模式 pattern，我們來看看是否能把字符串中所有符合 pattern 的日期表達式都找出來。

pattern.findall(input)

[''06/18/2019 13:00:00'',
  ''06/18/2019 13:30:00'',
  ''06/18/2019 14:00:00'']

結(jié)果是對的，之后你想怎么盤它就是你自己的事了，比如把 / 換成 -，比如用 datetime 里面的 striptime() 把日期里年、月、日、小時、分鐘和秒都獲取出來。

2.2

元組

創(chuàng)建元組

「元組」定義語法為

(元素1, 元素2, ..., 元素n)

關(guān)鍵點是「小括號 ()」和「逗號 ,」

小括號把所有元素綁在一起
逗號將每個元素一一分開

創(chuàng)建元組的例子如下：

t1 = (1, 10.31, 'python')t2 = 1, 10.31, 'python'print( t1, type(t1) )print( t2, type(t2) )

(1, 10.31, 'python') <class 'tuple'>
(1, 10.31, 'python') <class 'tuple'>

知識點

創(chuàng)建元組可以用小括號 ()，也可以什么都不用，為了可讀性，建議還是用 ()。此外對于含單個元素的元組，務(wù)必記住要多加一個逗號，舉例如下：

print( type( ('OK') ) )  # 沒有逗號 , print( type( ('OK',) ) ) # 有逗號 ,

<class 'str'>
<class 'tuple'>

看看，沒加逗號來創(chuàng)建含單元素的元組，Python 認為它是字符。

當(dāng)然也可以創(chuàng)建二維元組：

nested = (1, 10.31, 'python'), ('data', 11)nested

((1, 10.31, 'python'), ('data', 11))

索引和切片

元組中可以用整數(shù)來對它進行索引 (indexing) 和切片 (slicing)，不嚴謹?shù)闹v，前者是獲取單個元素，后者是獲取一組元素。接著上面二維元組的例子，先看看索引的代碼：

nested[0]print( nested[0][0], nested[0][1], nested[0][2] )

(1, 10.31, 'python')
1 10.31 python

再看看切片的代碼：

nested[0][0:2]

(1, 10.31)

不可更改

元組有不可更改 (immutable) 的性質(zhì)，因此不能直接給元組的元素賦值，例子如下 (注意「元組不支持元素賦值」的報錯提示)。

t = ('OK', [1, 2], True)t[2] = False

TypeError: 'tuple' object does not support item assignment

但是只要元組中的元素可更改 (mutable)，那么我們可以直接更改其元素，注意這跟賦值其元素不同。如下例 t[1] 是列表，其內(nèi)容可以更改，因此用 append 在列表后加一個值沒問題。

t[1].append(3)

('OK', [1, 2, 3], True)

內(nèi)置方法

元組大小和內(nèi)容都不可更改，因此只有 count 和 index 兩種方法。

t = (1, 10.31, 'python')print( t.count('python') )print( t.index(10.31) )

1
1

這兩個方法返回值都是 1，但意思完全不同

count('python') 是記錄在元組 t 中該元素出現(xiàn)幾次，顯然是 1 次
index(10.31) 是找到該元素在元組 t 的索引，顯然是 1

元組拼接

元組拼接 (concatenate) 有兩種方式，用「加號 +」和「乘號 *」，前者首尾拼接，后者復(fù)制拼接。

(1, 10.31, 'python') + ('data', 11) + ('OK',)(1, 10.31, 'python') * 2

(1, 10.31, 'python', 'data', 11, 'OK')
(1, 10.31, 'python', 1, 10.31, 'python')

解壓元組

解壓 (unpack) 一維元組 (有幾個元素左邊括號定義幾個變量）

t = (1, 10.31, 'python')(a, b, c) = tprint( a, b, c )

1 10.31 python

解壓二維元組 (按照元組里的元組結(jié)構(gòu)來定義變量）

t = (1, 10.31, ('OK','python'))(a, b, (c,d)) = tprint( a, b, c, d )

1 10.31 OK python

如果你只想要元組其中幾個元素，用通配符「*」，英文叫 wildcard，在計算機語言中代表一個或多個元素。下例就是把多個元素丟給了 rest 變量。

t = 1, 2, 3, 4, 5a, b, *rest, c = tprint( a, b, c )print( rest )

1 2 5
[3, 4]

如果你根本不在乎 rest 變量，那么就用通配符「*」加上下劃線「_」，劉例子如下：

a, b, *_ = tprint( a, b )

1 2

優(yōu)點缺點

優(yōu)點：占內(nèi)存小，安全，創(chuàng)建遍歷速度比列表快，可一賦多值。

缺點：不能添加和更改元素。

等等等，這里有點矛盾，元組的不可更改性即使優(yōu)點 (安全) 有時缺點？確實是這樣的，安全就沒那么靈活，靈活就沒那么安全?？纯创罄辛窝┓逶趺丛u價「不可更改性」吧

immutable 的好處實在是太多了：性能優(yōu)化，多線程安全，不需要鎖，不擔(dān)心被惡意修改或者不小心修改。

后面那些安全性的東西我也不大懂，性能優(yōu)化這個我可以來測試一下列表和元組。列表雖然沒介紹，但是非常簡單，把元組的「小括號 ()」該成「中括號 []」就是列表了。我們從創(chuàng)建、遍歷和占空間三方面比較。

創(chuàng)建

%timeit [1, 2, 3, 4, 5]%timeit (1, 2, 3, 4, 5)

62 ns ± 13.2 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
12.9 ns ± 1.94 ns per loop (mean ± std. dev. of 7 runs, 100000000 loops each)

創(chuàng)建速度，元組 (12.9ns) 碾壓列表 (62ns)。

遍歷

lst = [i for i in range(65535)]tup = tuple(i for i in range(65535))%timeit for each in lst: pass%timeit for each in tup: pass

507 μs ± 61.1 μs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
498 μs ± 18.7 μs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

遍歷速度兩者相當(dāng)，元組 (498 μs) 險勝列表 (507 μs)。

占空間

from sys import getsizeofprint( getsizeof(lst) )print( getsizeof(tup) )

578936
524328

列表比元組稍微廢點內(nèi)存空間。

2.3

列表

創(chuàng)建列表

「列表」定義語法為

[元素1, 元素2, ..., 元素n]

關(guān)鍵點是「中括號 []」和「逗號 ,」

中括號把所有元素綁在一起
逗號將每個元素一一分開

創(chuàng)建列表的例子如下：

l = [1, 10.31,'python']print(l, type(l))

[1, 10.31, 'python'] <class 'list'>

內(nèi)置方法

不像元組，列表內(nèi)容可更改 (mutable)，因此附加 (append, extend)、插入 (insert)、刪除 (remove, pop) 這些操作都可以用在它身上。

附加

l.append([4, 3])print( l )l.extend([1.5, 2.0, 'OK'])print( l )

[1, 10.31, 'python', [4, 3]]
[1, 10.31, 'python', [4, 3], 1.5, 2.0, 'OK']

嚴格來說 append 是追加，把一個東西整體添加在列表后，而 extend 是擴展，把一個東西里的所有元素添加在列表后。對著上面結(jié)果感受一下區(qū)別。

插入

l.insert(1, 'abc') # insert object before the index positionl

[1, 'abc', 10.31, 'python', [4, 3], 1.5, 2.0, 'OK']

insert(i, x) 在編號 i 位置前插入 x。對著上面結(jié)果感受一下。

刪除

l.remove('python') # remove first occurrence of objectl

[1, 'abc', 10.31, [4, 3], 1.5, 2.0, 'OK']

p = l.pop(3) # removes and returns object at index.  Only only pop 1 index position at any time.print( p )print( l )

[4, 3]
[1, 'abc', 10.31, 1.5, 2.0, 'OK']

remove 和 pop 都可以刪除元素

前者是指定具體要刪除的元素，比如 'python'
后者是指定一個編號位置，比如 3，刪除 l[3] 并返回出來

對著上面結(jié)果感受一下，具體用哪個看你需求。

切片索引

索引 (indexing) 和切片 (slicing) 語法在元組那節(jié)都講了，而且怎么判斷切片出來的元素在字符那節(jié)也講了，規(guī)則如下圖：

對照上圖看下面兩個例子 (順著數(shù)和倒著數(shù)編號)：

l = [7, 2, 9, 10, 1, 3, 7, 2, 0, 1]l[1:5]

[2, 9, 10, 1]

l[-4:]

[7, 2, 0, 1]

列表可更改，因此可以用切片來賦值。

l[2:4] = [999, 1000]l

[7, 2, 999, 1000, 1, 3, 7, 2, 0, 1]

切片的通用寫法是

start : stop : step

這三個在特定情況下都可以省去，我們來看看四種情況：

情況 1 - start :

print( l )print( l[3:] )print( l[-4:] )

[7, 2, 999, 1000, 1, 3, 7, 2, 0, 1]
[1000, 1, 3, 7, 2, 0, 1]
[7, 2, 0, 1]

以 step 為 1 (默認) 從編號 start 往列表尾部切片。

情況 2 - : stop

print( l )print( l[:6] )print( l[:-4] )

[7, 2, 999, 1000, 1, 3, 7, 2, 0, 1]
[7, 2, 999, 1000, 1, 3]
[7, 2, 999, 1000, 1, 3]

以 step 為 1 (默認) 從列表頭部往編號 stop 切片。

情況 3 - start : stop

print( l )print( l[2:4] )print( l[-5:-1] )

[7, 2, 999, 1000, 1, 3, 7, 2, 0, 1]
[999, 1000]
[3, 7, 2, 0]

以 step 為 1 (默認) 從編號 start 往編號 stop 切片。

情況 4 - start : stop : step

print( l )print( l[1:5:2] )print( l[:5:2] )print( l[1::2] )print( l[::2] )print( l[::-1] )

[7, 2, 999, 1000, 1, 3, 7, 2, 0, 1]
[2, 1000]
[7, 999, 1]
[2, 1000, 3, 2, 1]
[7, 999, 1, 7, 0]
[1, 0, 2, 7, 3, 1, 1000, 999, 2, 7]

以具體的 step 從編號 start 往編號 stop 切片。注意最后把 step 設(shè)為 -1，相當(dāng)于將列表反向排列。

列表拼接

和元組拼接一樣，列表拼接也有兩種方式，用「加號 +」和「乘號 *」，前者首尾拼接，后者復(fù)制拼接。

[1, 10.31, 'python'] + ['data', 11] + ['OK'][1, 10.31, 'python'] * 2

[1, 10.31, 'python', 'data', 11, 'OK']
[1, 10.31, 'python', 1, 10.31, 'python']

優(yōu)點缺點

優(yōu)點：靈活好用，可索引、可切片、可更改、可附加、可插入、可刪除。

缺點：相比 tuple 創(chuàng)建和遍歷速度慢，占內(nèi)存。此外查找和插入時間較慢。

2.4

字典

創(chuàng)建字典

「字典」定義語法為

{元素1, 元素2, ..., 元素n}

其中每一個元素是一個「鍵值對」- 鍵:值 (key:value)

關(guān)鍵點是「大括號 {}」,「逗號 ,」和「分號 :」

大括號把所有元素綁在一起
逗號將每個鍵值對一一分開
分號將鍵和值分開

創(chuàng)建字典的例子如下：

d = {'Name' : 'Tencent','Country' : 'China','Industry' : 'Technology','Code': '00700.HK','Price' : '361 HKD'}print( d, type(d) )

{'Name': 'Tencent', 'Country': 'China',
'Industry': 'Technology', 'Code': '00700.HK',
'Price': '361 HKD'} <class 'dict'>

內(nèi)置方法

字典里最常用的三個內(nèi)置方法就是 keys(), values() 和 items()，分別是獲取字典的鍵、值、對。

print( list(d.keys()),'\n' )print( list(d.values()), '\n' )print( list(d.items()) )

['Name', 'Country', 'Industry', 'Code', 'Price', 'Headquarter']

['Tencent', 'China', 'Technology', '00700.HK', '359 HKD', 'Shen Zhen']

[('Name', 'Tencent'), ('Country', 'China'),
 ('Industry', 'Technology'), ('Code', '00700.HK'),
 ('Price', '359 HKD'), ('Headquarter', 'Shen Zhen')]

此外在字典上也有添加、獲取、更新、刪除等操作。

添加

比如加一個「總部：深圳」

d['Headquarter'] = 'Shen Zhen'd

{'Name': 'Tencent',
'Country': 'China',
'Industry': 'Technology',
'Code': '00700.HK',
'Price': '361 HKD',
'Headquarter': 'Shen Zhen'}

獲取

比如想看看騰訊的股價是多少 (兩種方法都可以)

print( d['Price'] )print( d.get('Price') )

359 HKD
359 HKD

更新

比如更新騰訊的股價到 359 港幣

d['Price'] = '359 HKD'd

{'Name': 'Tencent',
'Country': 'China',
'Industry': 'Technology',
'Code': '00700.HK',
'Price': '359 HKD',
'Headquarter': 'Shen Zhen'}

刪除

比如去掉股票代碼 (code)

del d['Code']d

{'Name': 'Tencent',
 'Country': 'China',
 'Industry': 'Technology',
 'Price': '359 HKD',
 'Headquarter': 'Shen Zhen'}

或像列表里的 pop() 函數(shù)，刪除行業(yè) (industry) 并返回出來。

print( d.pop('Industry') )d

Technology

{'Name': 'Tencent',
 'Country': 'China',
 'Price': '359 HKD',
 'Headquarter': 'Shen Zhen'}

不可更改鍵

字典里的鍵是不可更改的，因此只有那些不可更改的數(shù)據(jù)類型才能當(dāng)鍵，比如整數(shù) (雖然怪怪的)、浮點數(shù) (雖然怪怪的)、布爾 (雖然怪怪的)、字符、元組 (雖然怪怪的)，而列表卻不行，因為它可更改?？磦€例子

d = {2 : 'integer key',10.31 : 'float key',True  : 'boolean key',('OK',3) : 'tuple key'}d

{2: 'integer key',
  10.31: 'float key',
  True: 'boolean key',
 ('OK', 3): 'tuple key'}

雖然怪怪的，但這些 2, 10.31, True, ('OK', 3) 確實能當(dāng)鍵。有個地方要注意下，True 其實和整數(shù) 1 是一樣的，由于鍵不能重復(fù)，當(dāng)你把 2 該成 1時，你會發(fā)現(xiàn)字典只會取其中一個鍵，示例如下：

d = {1 : 'integer key',10.31 : 'float key',True : 'boolean key',('OK',3) : 'tuple key'}d

{1: 'boolean key',
 10.31: 'float key',
 ('OK', 3): 'tuple key'}

那么如何快速判斷一個數(shù)據(jù)類型 X 是不是可更改的呢？兩種方法：

麻煩方法：用 id(X) 函數(shù)，對 X 進行某種操作，比較操作前后的 id，如果不一樣，則 X 不可更改，如果一樣，則 X 可更改。
便捷方法：用 hash(X)，只要不報錯，證明 X 可被哈希，即不可更改，反過來不可被哈希，即可更改。

先看用 id() 函數(shù)的在整數(shù) i 和列表 l 上的運行結(jié)果：

i = 1print( id(i) )i = i + 2print( id(i) )

1607630928
1607630992

l = [1, 2]print( id(l) )l.append('Python')print( id(l) )

2022027856840
2022027856840

整數(shù) i 在加 1 之后的 id 和之前不一樣，因此加完之后的這個 i (雖然名字沒變)，但是不是加前的那個 i 了，因此整數(shù)是不可更改的。
列表 l 在附加 'Python' 之后的 id 和之前一樣，因此列表是可更改的。

先看用 hash() 函數(shù)的在字符 s，元組 t 和列表 l 上的運行結(jié)果：

hash('Name')

7230166658767143139

hash( (1,2,'Python') )

3642952815031607597

hash( [1,2,'Python'] )

TypeError: unhashable type: 'list'

字符 s 和元組 t 都能被哈希，因此它們是不可更改的。列表 l 不能被哈希，因此它是可更改的。

優(yōu)點缺點

優(yōu)點：查找和插入速度快

缺點：占內(nèi)存大

2.5

集合

創(chuàng)建集合

「集合」有兩種定義語法，第一種是

{元素1, 元素2, ..., 元素n}

關(guān)鍵點是「大括號 {}」和「逗號 ,」

大括號把所有元素綁在一起
逗號將每個元素一一分開

第二種是用 set() 函數(shù)，把列表或元組轉(zhuǎn)換成集合。

set( 列表或元組 )

創(chuàng)建集合的例子如下 (用兩者方法創(chuàng)建 A 和 B)：

A = set(['u', 'd', 'ud', 'du', 'd', 'du'])B = {'d', 'dd', 'uu', 'u'}print( A )print( B )

{'d', 'du', 'u', 'ud'}
{'d', 'dd', 'u', 'uu'}

從 A 的結(jié)果發(fā)現(xiàn)集合的兩個特點：無序 (unordered) 和唯一 (unique)。由于 set 存儲的是無序集合，所以我們沒法通過索引來訪問，但是可以判斷一個元素是否在集合中。

B[1]

TypeError: 'set' object does not support indexing

'u' in B

True

內(nèi)置方法

用 set 的內(nèi)置方法就把它當(dāng)成是數(shù)學(xué)上的集，那么并集、交集、差集都可以玩通了。

并集 OR

print( A.union(B) )     # All unique elements in A or Bprint( A | B )          # A OR B

{'uu', 'dd', 'd', 'u', 'du', 'ud'}
{'uu', 'dd', 'd', 'u', 'du', 'ud'}

交集 AND

print( A.intersection(B) )   # All elements in both A and Bprint( A & B )               # A AND B

{'d', 'u'}
{'d', 'u'}

差集 A - B

print( A.difference(B) )     # Elements in A but not in Bprint( A - B )               # A MINUS B

{'ud', 'du'}
{'ud', 'du'}

差集 B - A

print( B.difference(A) )     # Elements in B but not in Aprint( B - A )               # B MINUS A

{'uu', 'dd'}
{'uu', 'dd'}

對稱差集 XOR

print( A.symmetric_difference(B) )   # All elements in either A or B, but not bothprint( A ^ B )                       # A XOR B

{'ud', 'du', 'dd', 'uu'}
{'ud', 'du', 'dd', 'uu'}

優(yōu)點缺點

優(yōu)點：不用判斷重復(fù)的元素

缺點：不能存儲可變對象

你看集合的「唯一」特性還不是雙刃劍，既可以是優(yōu)點，又可以是缺點，所有東西都有 trade-off 的，要不然它就沒有存在的必要了。

條件語句 & 迭代循環(huán)

在編寫程序時，我們要

在不同條件下完成不同動作，條件語句 (conditional statement) 賦予程序這種能力。

重復(fù)的完成某些動作，迭代循環(huán) (iterative loop) 賦予程序這種能力。

3.1

條件語句

條件語句太簡單了，大體有四種格式

if 語句
if-else 語句
if-elif-else 語句
nested 語句

看了下面四幅圖 (包含代碼) 應(yīng)該秒懂條件語句，其實任何會說話的人都應(yīng)該懂它。

if x > 0:print( 'x is positive' )

給定二元條件，滿足做事，不滿足不做事。

if-else

if x % 2 == 0:print( 'x is even' )else :print( 'x is odd' )

給定二元條件，滿足做事 A，不滿足做事 B。

if-elif-else

if x < y:print( 'x is less than y' )elif x > y:print( 'x is greater than y' )else:print( 'x and y are equal' )

給定多元條件，滿足條件 1 做事 A₁，滿足條件 2 做事 A₂，..., 滿足條件 n 做事 A_n。直到把所有條件遍歷完。

Nested if

if x == y:print( 'x and y are equal' )else:if x < y:print( 'x is less than y' )else:print( 'x is greater than y' )

給定多元條件，滿足條件 1 做事 A₁，不滿足就

給定多元條件，滿足條件 2 做事 A₂，不滿足就

...

直到把所有條件遍歷完。

3.2

迭代循環(huán)

對于迭代循環(huán)，Python 里面有「while 循環(huán)」和「for 循環(huán)」，沒有「do-while 循環(huán)」。

while 循環(huán)

n = 5while n > 0:print(n)    n = n-1print('I love Python')

5
4
3
2
1
I love Python

While 循環(huán)非常簡單，做事直到 while 后面的語句為 False。上例就是打印從 n (初始值為 5) 一直到 1，循環(huán)執(zhí)行了 5 次。

一般來說，在「while 循環(huán)」中，迭代的次數(shù)事先是不知道的，因為通常你不知道 while 后面的語句從 True 變成 False了。

for 循環(huán)

更多時候我們希望事先直到循環(huán)的次數(shù)，比如在列表、元組、字典等容器類數(shù)據(jù)上遍歷一遍，在每個元素層面上做點事情。這時候就需要「for 循環(huán)」了。

languages = ['Python', 'R', 'Matlab', 'C++']for language in languages:print( 'I love', language )print( 'Done!' )

I love Python
I love R
I love Matlab
I love C++
Done!

讀讀 Python 里面的「for 循環(huán)」是不是很像讀英文。通用形式的 for loop 如下

for a in A

do something with a

其中 for 和 in 是關(guān)鍵詞，A 是個可迭代數(shù)據(jù) (list, tuple, dic, set)，a 是 A 里面的每個元素，上句翻譯成中文是

對于 A 里面的每個 a

對 a 搞點事

回到具體例子，for loop 里面的 language 變量在每次循環(huán)中分別取值 Python, R, Matlab 和 C++，然后被打印。

最后介紹一個稍微有點特殊的函數(shù) enumerate()，和 for loop 一起用的語法如下

for i, a in enumerate(A)

do something with a

發(fā)現(xiàn)區(qū)別了沒？用 enumerate(A) 不僅返回了 A 中的元素，還順便給該元素一個索引值 (默認從 0 開始)。此外，用 enumerate(A, j) 還可以確定索引起始值為 j?？聪旅胬?。

languages = ['Python', 'R', 'Matlab', 'C++']for i, language in enumerate(languages, 1):print( i, 'I love', language )print( 'Done!' )

1 I love Python
2 I love R
3 I love Matlab
4 I love C++
Done!

總結(jié)

學(xué)習(xí)任何一種都要從最基本開始，基本的東西無外乎數(shù)據(jù)類型、條件語句和遞推循環(huán)。

數(shù)據(jù)類型分兩種：

單獨類型：整型、浮點型、布爾型
容器類型：字符、元組、列表、字典、集合

按照 Python 里「萬物皆對象」的思路，學(xué)習(xí)每一個對象里面的屬性 (attributes) 和方法 (methods)，你不需要記住所有，有個大概印象有哪些，通過 dir() 來鎖定具體表達式，再去官網(wǎng)上查詢所有細節(jié)。這么學(xué)真的很系統(tǒng)而簡單。此外學(xué)的時候一定要帶著“它的優(yōu)缺點是什么”這樣的問題，所有東西都有 trade-off，一個滿身都是缺點的東西就沒有存在的必要，既然存在肯定有可取之處。

條件語句 (if, if-else, if-elif-else, nested if) 是為了在不同條件下執(zhí)行不同操作，而迭代循環(huán) (while, for) 是重復(fù)的完成相同操作。

抓住上面大框架，最好還要以目標(biāo)導(dǎo)向 (我學(xué) python 就是為了搞量化交易希望能躺著賺錢)，別管這目標(biāo)難度如何，起碼可以保證我累得時候還雞血滿滿不會輕言放棄。這樣我就足夠主動的去學(xué)一樣?xùn)|西并學(xué)精學(xué)深，目標(biāo)越難完成，我主動性就越強。

之后所有的細節(jié)都可以慢慢來，雖然我覺得本篇已經(jīng)挖了不少細節(jié)了，像 hashability，但肯定還有更多等著去挖，半篇帖子就想覆蓋 Python 所有內(nèi)容不是開玩笑嗎？但