lua table remove元素的問題 - rexzhao | IT工程師數位筆記本 | 數位生活分享 | 痞客邦

文章出處

當我在工作中使用lua進行開發時，發現在lua中有4種方式遍歷一個table，當然，從本質上來說其實都一樣，只是形式不同，這四種方式分別是：

for key, value in pairs(tbtest) do
XXX
end
for key, value in ipairs(tbtest) do
XXX
end
for i=1, #(tbtest) do
XXX
end
for i=1, table.maxn(tbtest) do
XXX
end

前兩種是泛型遍歷，后兩種是數值型遍歷。當然你還會說lua的table遍歷還有很多種方法啊，沒錯，不過最常見的這些遍歷確實有必要弄清楚。

這四種方式各有特點，由于在工作中我幾乎每天都會使用遍歷table的方法，一開始也非常困惑這些方式的不同，一段時間后才漸漸明白，這里我也是把自己的一點經驗告訴大家，對跟我一樣的lua初學者也許有些幫助（至少當初我在寫的時候在網上就找了很久，不知道是因為大牛們都認為這些很簡單，不需要說，還是因為我笨，連這都要問）。

首先要明確一點，就是lua中table并非像是C/C++中的數組一樣是順序存儲的，準確來說lua中的table更加像是C++中的map，通過Key對應存儲Value，但是并非順序來保存key-value對，而是使用了hash的方式，這樣能夠更加快速的訪問key對應的value，我們也知道hash表的遍歷需要使用所謂的迭代器來進行，同樣，lua也有自己的迭代器，就是上面4種遍歷方式中的pairs和ipairs遍歷。但是lua同時提供了按照key來遍歷的方式（另外兩種，實質上是一種），正式因為它提供了這種按key的遍歷，才造成了我一開始的困惑，我一度認為lua中關于table的遍歷是按照我table定義key的順序來的。

下面依次來講講四種遍歷方式，首先來看for k,v in pairs(tbtest) do這種方式：

先看效果：

tbtest = {
[1] = 1,
[2] = 2,
[3] = 3,
[4] = 4,
}
for key, value in pairs(tbtest) do
print(value)
end

我認為輸出應該是1，2，3，4，實際上的輸出是1，2，4，3。我因為這個造成了一個bug，這是后話。

也就是說for k,v in pairs(tbtest) do 這樣的遍歷順序并非是tbtest中table的排列順序，而是根據tbtest中key的hash值排列的順序來遍歷的。

當然，同時lua也提供了按照key的大小順序來遍歷的，注意，是大小順序，仍然不是key定義的順序，這種遍歷方式就是for k,v in ipairs(tbtest) do。

for k,v in ipairs(tbtest) do 這樣的循環必須要求tbtest中的key為順序的，而且必須是從1開始，ipairs只會從1開始按連續的key順序遍歷到key不連續為止。

tbtest = {
[1] = 1,
[2] = 2,
[3] = 3,
[5] = 5,
}
for k,v in ipairs(tbtest) do
print(v)
end

只會打印1，2，3。而5則不會顯示。

local tbtest = {
[2] = 2,
[3] = 3,
[5] = 5,
}
for k,v in ipairs(tbtest) do
print(v)
end

這樣就一個都不會打印。

第三種遍歷方式有一種神奇的符號'#'，這個符號的作用是是獲取table的長度，比如：

tbtest = {
[1] = 1,
[2] = 2,
[3] = 3,
}
print(#(tbtest))

打印的就是3

tbtest = {
[1] = 1,
[2] = 2,
[6] = 6,
}
print(#(tbtest))

這樣打印的就是2，而且和table內的定義順序沒有關系，無論你是否先定義的key為6的值，‘#’都會查找key為1的值開始。

如果table的定義是這樣的：

tbtest = {
["a"] = 1,
[2] = 2,
[3] = 3,
}
print(#(tbtest))

那么打印的就是0了。因為‘#’沒有找到key為1的值。同樣：

tbtest = {
[“a”] = 1,
[“b”] = 2,
[“c”] = 3,
}
print(#(tbtest))

打印的也是0

所以，for i=1, #(tbtest) do這種遍歷，只能遍歷當tbtest中存在key為1的value時才會出現結果，而且是按照key從1開始依次遞增1的順序來遍歷，找到一個遞增不是1的時候就結束不再遍歷，無論后面是否仍然是順序的key，比如：

table.maxn獲取的只針對整數的key，字符串的key是沒辦法獲取到的，比如：

tbtest = {
[1] = 1,
[2] = 2,
[3] = 3,
}
print(table.maxn(tbtest))
tbtest = {
[6] = 6,
[1] = 1,
[2] = 2,
}
print(table.maxn(tbtest))

這樣打印的就是3和6，而且和table內的定義順序沒有關系，無論你是否先定義的key為6的值，table.maxn都會獲取整數型key中的最大值。

如果table的定義是這樣的：

tbtest = {
["a"] = 1,
[2] = 2,
[3] = 3,
}
print(table.maxn(tbtest))

那么打印的就是3了。如果table是：

tbtest = {
[“a”] = 1,
[“b”] = 2,
[“c”] = 3,
}
print(table.maxn(tbtest))
print(#(tbtest))

那么打印的就全部是0了。

換句話說，事實上因為lua中table的構造表達式非常靈活，在同一個table中，你可以隨意定義各種你想要的內容，比如：

tbtest = {
[1] = 1,
[2] = 2,
[3] = 3,
["a"] = 4,
["b"] = 5,
}

同時由于這個靈活性，你也沒有辦法獲取整個table的長度，其實在coding的過程中，你會發現，你真正想要獲取整個table長度的地方幾乎沒有，你總能采取一種非常巧妙的定義方式，把這種需要獲取整個table長度的操作避免掉，比如：

tbtest = {
tbaaa = {
[1] = 1,
[2] = 2,
[3] = 3,
},
["a"] = 4,
["b"] = 5,
}

你可能會驚訝，上面這種table該如何遍歷呢？

for k, v in pairs(tbtest) do
print(k, v)
end

輸出是：a 4 b 5 tbaaa table:XXXXX。

由此你可以看到，其實在table中定義一個table，這個table的名字就是key，對應的內容其實是table的地址。

當然，如果你用

for k, v in ipairs(tbtest) do
print(k,v)
end

來遍歷的話，就什么都不會打印，因為沒有key為1的值。但當你增加一個key為1的值時，ipairs只會打印那一個值，現在你明白ipairs是如何工作的吧。

既然這里談到了遍歷，就說一下目前看到的幾種針對table的遍歷方式：

for i=1, #tbtest do --這種方式無法遍歷所有的元素，因為'#'只會獲取tbtest中從key為1開始的key連續的那幾個元素，如果沒有key為1，那么這個循環將無法進入

for i=1, table.maxn(tbtest) do --這種方式同樣無法遍歷所有的元素，因為table.maxn只會獲取key為整數中最大的那個數，遍歷的元素其實是查找tbtest[1]~tbtest[整數key中最大值]，所以，對于string做key的元素不會去查找，而且這么查找的效率低下，因為如果你整數key中定義的最大的key是10000，然而10000以下的key沒有幾個，那么這么遍歷會浪費很多時間，因為會從1開始直到10000每一個元素都會查找一遍，實際上大多數元素都是不存在的，比如：

tbtest = {
[1] = 1,
[10000] = 2,
}
local count = 0
for i=1, table.maxn(tbtest) do
count = count + 1
print(tbtest[i])
end
print(count)

你會看到打印結果是多么的坑爹，只有1和10000是有意義的，其他的全是nil，而且count是10000。耗時非常久。一般我不這么遍歷。但是有一種情況下又必須這么遍歷，這個在我的工作中還真的遇到了，這是后話，等講完了再談。

for k, v in pairs(tbtest) do

這個是唯一一種可以保證遍歷tbtest中每一個元素的方式，別高興的太早，這種遍歷也有它自身的缺點，就是遍歷的順序不是按照tbtest定義的順序來遍歷的，這個前面講到過，當然，對于不需要順序遍歷的用法，這個是唯一可靠的遍歷方式。

for k, v in ipairs(tbtest) do

這個只會遍歷tbtest中key為整數，而且必須從1開始的那些連續元素，如果沒有1開始的key，那么這個遍歷是無效的，我個人認為這種遍歷方式完全可以被改造table和for i=1, #(tbtest) do的方式來代替，因為ipairs的效果和'#'的效果，在遍歷的時候是類似的，都是按照key的遞增1順序來遍歷。

好，再來談談為什么我需要使用table.maxn這種非常浪費的方式來遍歷，在工作中，我遇到一個問題，就是需要把當前的周序，轉換成對應的獎勵，簡單來說，就是從一個活動開始算起，每周的獎勵都不是固定的，比如1~4周給一種獎勵，5~8周給另一種獎勵，或者是一種排名獎勵，1~8名給一種獎勵，9~16名給另一種獎勵，這種情況下，我根據長久的C語言的習慣，會把table定義成這個樣子：

tbtestAward = {
[8] = 1,
[16] = 3,
}

這個代表，1~8給獎勵1，9~16給獎勵3。這樣定義的好處是獎勵我只需要寫一次（這里的獎勵用數字做了簡化，實際上獎勵也是一個大的table，里面還有非常復雜的結構）。然后我就遇到一個問題，即我需要根據周序數，或者是排名序數來確定給哪一種獎勵，比如當前周序數是5，那么我應該給我定義好的key為8的那一檔獎勵，或者當前周序數是15，那么我應該給獎勵3。由此讀者看出，其實我定義的key是一個分界，小于這個key而大于上一個key，那么就給這個key的獎勵，這就是我判斷的條件。邏輯上沒有問題，但是lua的遍歷方式卻把我狠狠地坑了一把。讀者可以自己想一想我上面介紹的4種遍歷方式，該用哪一種來實現我的這種需求呢？這個函數的大致框架如下：

function GetAward(nSeq)
for 遍歷整個獎勵表 do
if 滿足key的條件 then
return 返回對應獎勵的key
end
end
return nil
end

我也不賣關子了，分別來說一說吧，首先因為我的key不是連續的，而且沒有key為1的值，所以ipairs和'#'遍歷是沒用的。這種情況下理想的遍歷貌似是pairs，因為它會遍歷我的每一個元素，但是讀者不要忘記了，pairs遍歷并非是按照我定義的順序來遍歷，如果我真的使用的條件是：序數nSeq小于這個key而大于上一個key，那么就返回這個key。那么我無法保證程序執行的正確性，因為key的順序有可能是亂的，也就是有可能先遍歷到的是key為16的值，然后才是key為8的值。

這么看來我只剩下table.maxn這么一種方式了，于是我寫下了這種代碼：

for i=1, table.maxn(tbtestAward) do
if tbtestAward[i] ~= nil then
if nSeq <= i then
return i
end
end
end

這么寫效率確實低下，因為實際上還是遍歷了從key為1開始直到key為table.maxn中間的每一個值，不過能夠滿足我上面的要求。當時我是這么實現的，因為這個獎勵表會不斷的發生變化，這樣我每次修改只需要修改這個獎勵表就能夠滿足要求了，后來我想了想，覺得其實我如果自己再定義一個序數轉換成對應的獎勵數種類的表就可以避免這種坑爹的操作了，不過如果獎勵發生修改，我需要統一排查的地方就不止這個獎勵表了，權衡再三，我還是沒有改，就這么寫了。沒辦法，不斷變化的需求已經把我磨練的忘記了程序的最高理想。我甚至愿意犧牲算法的效率而去追求改動的穩定性。在此哀悼程序員的無奈。我這種時間換空間的做法確實不知道好不好。

后來我在《Programming In Lua》中看到了一個神奇的迭代器，使用它就可以達到我想要的這種遍歷方式，而且不需要去遍歷那些不存在的key。它的方法是把你所需要遍歷的table里的key按照遍歷順序放到另一個臨時的table中去，這樣只需要遍歷這個臨時的table按順序取出原table中的key就可以了。如下：

首先定義一個迭代器：

function pairsByKeys(t)
local a = {}
for n in pairs(t) do
a[#a+1] = n
end
table.sort(a)
local i = 0
return function()
i = i + 1
return a[i], t[a[i]]
end
end

然后在遍歷的時候使用這個迭代器就可以了，table同上，遍歷如下：

for key, value in pairsByKeys(tbtestAward) do
if nSeq <= key then
return key
end
end

并且后來我發現有了這個迭代器，我根本不需要先做一步獲取是哪一檔次的獎勵的操作，直接使用這個迭代器進行發獎就可以了。大師就是大師，我怎么就沒想到呢！

還有些話我還沒有說，比如上面數值型遍歷也并非是像看起來那樣進行遍歷的，比如下面的遍歷：

tbtest = {
[1] = 1,
[2] = 2,
[3] = 3,
[5] = 5,
}
for i=1, #(tbtest) do
print(tbtest[i])
end

打印的順序是：1，2，3。不會打印5，因為5已經不在table的數組數據塊中了，我估計是被放到了hash數據塊中，但是當我修改其中的一些key時，比如：

tbtest = {
[1] = 1,
[2] = 2,
[4] = 4,
[5] = 5,
}
for i=1, #(tbtest) do
print(tbtest[i])
end

打印的內容卻是：1，2，nil，4，5。這個地方又遍歷到了中間沒有的key值，并且還能繼續遍歷下去。我最近正在看lua源碼中table的實現部分，已經明白了是怎么回事，不過我想等我能夠更加清晰的闡述lua中table的實現過程了再向大家介紹。用我師傅的話說就是不要使用一些未定義的行為方法，避免在工作中出錯，不過工作外，我還是希望能明白未定義的行為中那些必然性，o(︶︿︶)o 唉！因果論的孩子傷不起。等我下一篇博文分析lua源碼中table的實現就能夠更加清晰的說明這些了。

---------------------------------------------------------------------------------------------分割線-----------------------------------------------------------------------------------------------------------

原文 http://childhood.logdown.com/posts/200499/lua-table-how-to-safely-remove-an-element

在Lua中，table如何安全的移除元素這點挺重要，因為如果不小心，會沒有正確的移除，造成內存泄漏。

引子

比如有些朋友常常這么做，大家看有啥問題

將test表中的偶數移除掉

local test = { 2, 3, 4, 8, 9, 100, 20, 13, 15, 7, 11}
for i, v in ipairs( test ) do
  if v % 2 == 0 then
    table.remove(test, i)
  end
end

for i, v in ipairs( test ) do
  print(i .. "====" .. v)
end

打印結果：

1====3
2====8
3====9
4====20
5====13
6====15
7====7
8====11
[Finished in 0.0s]

有問題吧，20怎么還在？這就是在遍歷中刪除導致的。

如何做呢？

Let's get started!

local test = { 'a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p' }
local remove = { a = true, b = true, c = true, e = true, f = true, p = true }

local function dump(table)
    for k, v in pairs( table ) do
        print(k)
        print(v)
        print("*********")
    end
end

說明：一般我們不在循環中刪除，在循環中刪除會造成一些錯誤。這是可以建立一個remove表用來標記將要刪除的，如上面例子，把將要刪除的標記為true

方法1 從后往前刪除

for i = #test, 1, -1 do
    if remove[test[i]] then
        table.remove(test, i)
    end
end

dump(test)

為什么不從前往后，朋友們可以測試，table.remove操作后，后面的元素會往前移位，這時候后續的刪除索引對應的元素已經不是之前的索引對應的元素了。

方法2 while刪除

local i = 1
while i <= #test do
  if remove[test[i]] then
    table.remove(test, i)
  else
    i = i + 1
  end
end

dump(test)

方法3 quick中提供的removeItem

function table.removeItem(list, item, removeAll)
  local rmCount = 0
  for i = 1, #list do
    if list[i - rmCount] == item then
      table.remove(list, i - rmCount)
      if removeAll then
        rmCount = rmCount + 1
      else
        break
      end
    end
  end
end

for k, v in pairs( remove ) do
  table.removeItem(test, k)
end

下面附帶一個自己些的遍歷刪除的例子

local bulletDel = {}--存放刪除子彈元素的table

local enemyDel = {}--存放刪除敵機的table

for k_bullet, v_bullet in ipairs(bullet) do

local bulletPoint = cc.p(v_bullet:getPositionX(),v_bullet:getPositionY())

for k_enemy, v_enemy in ipairs(enemy) do

local enemyRect = v_enemy:getBoundingBox()

if cc.rectContainsPoint(enemyRect,bulletPoint) then

table.insert(bulletDel,k_bullet)--這里有個小技巧，把要刪除的數據的表的索引放到刪除表緩存中，這樣在刪除就很方便了

table.insert(enemyDel,k_enemy)

end

for key,value in ipairs(bulletDel) do

bullet[value]:removeSelf()--在游戲中把子彈刪除

table.remove(bullet,value)

end

for key,value in ipairs(enemyDel) do

enemy[value]:removeSelf()

table.remove(enemy,value)

end

總結一下就是 lua 的table是以hash的形式存儲使用迭代器來遍歷也就是說并不會按照key的順序從前往后排列此為坑1 刪除元素的時候前面的元素刪除后面的元素會順序前移故不能達到刪除指定元素的目的應該從后忘前刪除也就是逆序刪除此坑2 切記切記

文章列表

不含病毒。www.avast.com

大師兄

IT工程師數位筆記本

大師兄發表在痞客邦留言(0) 人氣( 123 )

全站分類：數位生活
個人分類：生活學習

▲top

請先登入以發表留言。

IT工程師數位筆記本

If you give someone a program , you will frustrate them for a day; if you teach them how to program, you will frustrate them for a lifetime.IT 這段話的意思是，如果你交給某人一隻程式，你將折磨他一整天;如果你教會某人如何寫程式，你將折磨他一輩子。