Bài giảng Phân tích và thiết kế giải thuật - Chương 4: Chiến lược biến thể-để-trị (Transform-and-conquer)

nNội dung

nChiến lược Biến thể-để-trị

nGiải thuật Gauss để giải hệ phương trình tuyến tính

nCấu trúc heap và heapsort

nGiải thuật Horner để định trị đa thức

nSo trùng dòng ký tự bằng giải thuật Rabin-Karp

ppt 36 trang thiennv 7700
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Phân tích và thiết kế giải thuật - Chương 4: Chiến lược biến thể-để-trị (Transform-and-conquer)", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pptbai_giang_phan_tich_va_thiet_ke_giai_thuat_chuong_4_chien_lu.ppt

Nội dung text: Bài giảng Phân tích và thiết kế giải thuật - Chương 4: Chiến lược biến thể-để-trị (Transform-and-conquer)

  1. 3. Cấu trúc dữ liệu heap và heapsort Hàng đợi có độ ưu tiên (a priority-queue) là cấu trúc dữ liệu mà hỗ trợ ít nhất hai tác vụ: ❑ thêm một phần tử mới vào cấu trúc ❑ Tìm phần tử có độ ưu tiên lớn nhất ❑ xóa bỏ phần tử có độ ưu tiên lớn nhất Hàng đợi có độ ưu tiên khác với hàng đợi thông thường ở điểm khi lấy phần tử ra khỏi hàng đợi thì đó không phải là phần tử cũ nhất trong hàng đợi mà là phần tử có độ ưu tiên lớn nhất trong hàng đợi. 11
  2. Thi công hàng đợi có độ ưu tiên Hàng đợi có độ ưu tiên như đã mô tả là một ví dụ về kiểu dữ liệu trừu tượng. Có hai cách để thi công hàng đợi có độ ưu tiên: 1. Dùng mảng để thi công hàng đợi có độ ưu tiên (Cách này thì đơn giản khi thêm vào một phần tử mới nhưng khi xóa bỏ phần tử có độ ưu tiên lớn nhất ra khỏi hàng đợi thì độ phức tạp sẽ cao.) 2. Dùng cấu trúc dữ liệu heap. 12
  3. Cấu trúc dữ liệu heap Cấu trúc dữ liệu mà có thể hỗ trợ cho các tác vụ làm việc với hàng đợi có độ ưu tiên sẽ chứa các mẩu tin trong một mảng sao cho: mỗi khóa phải lớn hơn khóa ở hai vị trí khác trong mảng. Tương tự mỗi khóa trong hai khóa này phải lớn hơn hai trị khóa khác và cứ như thế Thứ tự này sẽ dễ thấy hơn khi ta diễn tả mảng như một cấu trúc cây với những đường nối mỗi khóa xuống hai khóa nhỏ hơn. Các trị khóa trong cấu trúc cây thỏa điều kiện heap như sau: Khóa tại mỗi nút cần phải lớn hơn (hay bằng) các khóa ở hai con của nó (nếu có). Điều này hàm ý trị khóa lớn nhất ở nút rễ. 13
  4. Thí dụ: Heap dưới dạng cây nhị phân k 1 2 3 4 5 6 7 8 9 10 11 12 a[k] X T O G S M N A E R A I 14
  5. Heap dưới dạng một mảng ◼ Ta có thể diễn tả dạng cây của heap thành một mảng bằng cách đặt nút rễ tại vị trí 1 của mảng, các con của nó tại vị trí 2 và 3, các nút ở các mức kế tiếp ở các vị trí 4, 5, 6 và 7, v.v k 1 2 3 4 5 6 7 8 9 10 11 12 a[k] X T O G S M N A E R A I Từ một nút dễ dàng để đi tới nút cha và các nút con của nó. • Cha một nút ở vị trí j sẽ là nút ở vị trí j div 2. • Hai con của một nút ở vị trí j sẽ ở các vị trí 2j và 2j+1. 15
  6. Các lối đi trên heap ◼ Một heap là một cây nhị phân, được diễn tả như là một mảng trong đó mỗi nút thỏa mãn điều kiện heap. Đặc biệt, phần tử có khóa lớn nhất luôn ở vị trí thứ nhất của mảng. ◼ Tất cả các giải thuật làm việc trên heap đi dọc theo một lối đi nào đó từ nút rễ xuống mức đáy (bottom) của heap. Trong một heap có N nút, tất cả các lối đi (path) thường có lgN nút trên đó. 16
  7. Các giải thuật trên Heap Có hai tác vụ quan trọng làm việc trên heap: thêm vào phần tử mới và xóa bỏ phần tử lớn nhất ra khỏi heap. 1. Tác vụ thêm vào (insert) Tác vụ này sẽ làm tăng kích thước của heap lên thêm một phần tử. N được tăng thêm 1. Và phần tử mới được đặt vào tại vị trí a[N], nhưng lúc đó điều kiện heap có thể sẽ bị vi phạm. Nếu điều kiện heap bị vi phạm, nó sẽ được khắc phục bằng cách hoán đổi phần tử mới với cha của nó. Điều này lại có thể gây ra vi phạm điều kiện heap và nó sẽ được khắc phục tiếp với cùng một cách tương tự. 17
  8. Tác vụ thêm vào procedure upheap(k:integer) var v: integer; begin v :=a[k]; a[0]:= maxint; while a[k div 2] <= v do begin a[k]:= a[k div 2 ]; k:=k div 2 end; a[k]:= v end; procedure insert(v:integer); begin N:= N+1; a[N] := v ; upheap(N) end; 18
  9. Thêm (P) vào heap M 19
  10. Tác vụ xóa bỏ phần tử lớn nhất ◼ Tác vụ xóa sẽ làm giảm kích thước của heap một đơn vị, tức nó làm giảm N một đơn vị. ◼ Nhưng phần tử lớn nhất (tức a[1]) sẽ được xóa bỏ và được thay thể bằng phần tử mà đã ở vị trí a[N]. Nếu trị khóa tại nút rễ quá nhỏ, nó phải được di chuyển xuống để thỏa mãn điều kiện heap. ◼ Thủ tục downheap thực hiện việc di chuyển phần tử đang ở nút rễ xuống bằng cách hoán đổi nút ở vị trí k với nút lớn hơn trong hai nút con của nó, nếu cần và dừng lại khi nút ở k lớn hơn hai nút con của nó. 20
  11. Tác vụ xóa bỏ procedure downheap(k: integer); label 0 ; var j, v : integer; begin v:= a[k]; while k = a[j] then go to 0; a[1] := a[N]; N := N-1; a[k]:= a[j]; k:= j; downheap(1); end; end; 0: a[k]: =v end; 21
  12. Thí dụ về tác vụ xóa Trước khi xóa M Sau khi xóa 22
  13. Độ phức tạp của các tác vụ trên heap Tính chất 3.1: Mọi tác vụ thêm vào, xóa bỏ, downheap, upheap đòi hỏi ít hơn 2lgN so sánh khi thực hiện trên một heap gồm N phần tử. Tất cả những tác vụ này phải đi dọc theo một lối đi giữa nút rễ cho đến cuối heap mà bao gồm ít hơn lgN phần tử với một heap gồm N phần tử. Thừa số 2 là do tác vụ downheap khi xóa bỏ mà cần hai thao tác so sánh trong vòng lặp trong và các thao tác khác chỉ đòi hỏi lgN lần so sánh. 23
  14. Giải thuật heapsort Ý tưởng: Giải thuật bao gồm 2 công tác (1) tạo một heap chứa những phần tử cần sắp thứ tự và (2) lần lượt lấy chúng ra khỏi heap theo một thứ tự. M : kích thước của heap N: số phần tử cần được sắp thứ tự. N:=0; for k:= 1 to M do insert(a[k]); /* construct the heap */ for k:= M downto 1 do a[k]:= remove; /*putting the element removed into the array a */ 24
  15. Độ phức tạp của heap sort Tính chất: Heapsort dùng ít hơn 3MlgM lần so sánh để sắp thứ tự M phần tử. Giới hạn trên này xuất phát từ giải thuật heapsort và tính chất của hai tác vụ thêm vào/xóa bỏ trên heap. Vòng for thứ nhất tốn MlgM lần so sánh. Vòng for thứ hai tốn 2MlgM lần so sánh. Tổng cọng: MlgM + 2MlgM = 3MlgM. Heapsort là một thí dụ điển hình của chiến lược Biến thể-để-trị, dùng kỹ thuật “biến đổi biểu diễn” (representation change) 25
  16. 4. Giải thuật Horner để định trị đa thức Ta cần định trị đa thức sau n n-1 p(x) = anx + an-1x + + a1x + a0 (4.1) tại một điểm x. G.H Horner, một nhà toán học người Anh, cách đây 150 năm đã đưa ra một qui tắc đinh trị đa thức rất hữu hiệu. Qui tắc Horner là một thí dụ tốt về chiến lược Biến thể-để- trị dùng kỹ thuật “thay đổi biểu diễn” (representation change). Từ công thức 4.1 ta có thể thu được một công thức mới bằng cách liên tiếp dùng x làm thừa số chung trong những đa thức con còn lại với số mũ giảm dần. p(x) = ( (anx + an-1)x+ )x + a0 (4.2) 26
  17. Giải thuật Horner Horner(P[0 n],x) // Mảng P[0 n] chứa các hệ số của đa thức. p := P[n]; for j := n -1 down to 0 do p := p*x + P[i]; return p; Tổng số phép nhân và tổng số phép cọng trong giải thuật chỉ là n. Trong khi đó nếu tính trực tiếp đa thức thì chỉ riêng số hạng n anx đã cần đến n phép nhân. Giải thuật Horner là giải thuật tối ưu để định trị đa thức. 27
  18. 5. So trùng dòng ký tự bằng giải thuật Rabin-Karp ◼ So trùng dòng ký tự: tìm tất cả sự xuất hiện của một khuôn mẫu (pattern) trong một văn bản (text). ◼ Văn bản là một mảng ký tự T[1 n] chiều dài n và một khuôn mẫu là một mảng P[1 m] chiều dài m. ◼ Các phần tử của P và T là những ký tự lấy từ một tập ký tự (alphabet) . ◼ Khuôn mẫu P xuất hiện với bước dịch chuyển(shift) s trong văn bản T (tức là, P xuất hiện bắt đầu từ vị trí s+1 trong văn bản T) nếu 1 s n – m và T[s+1 s+m] = P[1 m]. ◼ Nếu P xuất hiện với bước dịch chuyển s trong T, thì ta bảo s là một bước dịch chuyển hợp lệ (valid shift); ngược lại ta bảo s là một bước dịch chuyển không hợp lệ (invalid shift). 28
  19. ◼ Bài toán so trùng dòng ký tự là bài toán tìm tất cả những bước dịch chuyển hợp lệ mà một khuôn mẫu P xuất hiện trong một văn bản T cho trước. Văn bản abcabaabcabac Khuôn mẫu abaabcabac Bước dịch chuyển: s = 3 Giải thuật Rabin-Karp vận dụng những khái niện căn bản trong lý thuyết số chẳng hạn sự tương đương của hai số modulo một số thứ ba. 29
  20. Giải thuật Rabin-Karp ◼ Giả sử  = {0, 1, 2, , 9}, tức mỗi ký tự là một ký số thập phân. (Trong trường hợp tổng quát, mỗi ký tự là một ký số của cơ hệ d, tức là d = | |.) ◼ Ta có thể xem một dòng gồm k ký tự kế tiếp diễn tả một số thập phân có chiều dài k. Dòng ký tự “31415” tương ứng với trị số thập phân 31415. ◼ Cho một khuôn mẫu P[1 m], gọi p là giá trị thập phân tương ứng với khuôn mẫu. ◼ Cho một văn bản T[1 n], gọi ts là trị số thập phân của dòng con chiều dài m T[s+1 s+m], với s = 0, 1, , n-m. ◼ ts = p nếu và chỉ nếu T[s+1 s+m] = P[1 m] và s là một bước dịch chuyển hợp lệ nếu và chỉ nếu ts = p 30
  21. ◼ Ta có thể tính p trong thời gian O(m) dùng qui tắc Horner: p = P[m] + 10*(P[m-1] + 10*(P[m-2] + + 10*(P[2] + 10*P[1]) )) ◼ Giá trị t0 có thể được tính một cách tương tự từ T[1 m] trong thời gian O(m). ◼ Chú ý: ts+1 có thể được tính từ ts: m-1 ts+1 = 10(ts – 10 T[s+1]) + T[s+m+1] (5.1) Thí dụ: Nếu m = 5 và ts = 31415, thì ta sẽ bỏ ký số bậc cao T[s+1] = ‘3’ và đưa vào ký số bậc thấp là ‘2’ để đạt giá trị: ts+1 = 10(31415 – 10000.3) + 2 = 14152 31
  22. ◼ Mỗi lần thực thi phương trình (5.1) sẽ cần tiến hành một số lượng phép toán số học cố định. ◼ Việc tính toán t1, t2, , tn-m tỉ lệ với O(n-m). ◼ Như vậy, p và t0, t1, , tn-m có thể được tính trong chi phí thời gian O(m) +O(m) + O(n-m) O(n + m). ◼ Nhưng p và ts có thể quá lớn đến nỗi máy tính không thể biểu diễn được. Để khắc phục vấn đề này, ta tính p và các ts modulo một đại lượng q thích hợp. ◼ Đại lượng q thường được chọn là một số nguyên tố sao cho 10q thì chứa được trong một từ của máy tính. ◼ Trong trường hợp tổng quát, với bộ mẫu tự gồm d ký tự {0, 1, , d-1}, ta chọn q sao cho dq chứa được trong một từ của máy tính. 32
  23. ◼ Và phương trình (5.1) trở thành: ts+1 = d(ts – hT[s+1]) + T[s+m+1])mod q (5.2) với h = dm-1 (mod q) ◼ Tuy nhiên, ts  p (mod q) không hàm ý ts = p. ◼ Mặt khác, nếu ts p (mod q) thì ta có thể khẳng định ts p, và như vậy bước dịch chuyển s là không hợp lệ. ◼ Chúng ta có thể dùng cách thử ts  p (mod q) để loại bỏ những bước dịch chuyển không hợp lệ s. ◼ Một bước dịch chuyển s mà thỏa ts  p (mod q) thì phải được thử nghiệm thêm để xem s có thực sự là bước dịch chuyển hợp lệ hay chỉ là một sự khớp trùng giả (spurious hit) mà thôi . Giải thuật Rabin-Karp thể hiện rõ nét tinh thần chiến lược Biến thể-để-trị 33
  24. Thí dụ: |2| 3| 5| 9| 0| 2| 3| 1| 4| 1| 5| 2| 6| 7| 3| 9| 9| 2| 1| ___   | 7| |2| 3| 5| 9| 0| 2| 3| 1| 4| 1| 5| 2| 6| 7| 3| 9| 9| 2| 1| ___  ___  ___      | 8| 9| 3|11| 0| 1| 7| 8| 4| 5|10|11| 7| 9|11| valid spurious match match | 3| 1| 4| 1| 5| 2| ___    | 7| 8| 14152 = (31415 – 3 1000) 10 + 2 (mod 13) = 8 (mod 13) 34
  25. procedure RABIN-KARP-MATCHER(T, P, d, q); /* T is the text, P is the pattern, d is the radix and q is the prime */ begin Thời gian thực thi của RABIN- n: = |T|; m: = |P|; KARP-MATCHER là O((n – m + h: = dm-1 mod q; 1)m) trong trường hợp xấu nhất p: = 0; t0: = 0; vì khi đó giải thuật phải kiểm tra for i: = 1 to m do lại mọi bước dịch chuyển hợp begin lệ. p: = (d*p + P[i])mod q; t : = (d*t + T[i])mod q 0 0 Trong nhiều ứng dụng, thường end chỉ có một vài bước dịch for s: = 0 to n – m do chuyển hợp lệ và do đó thời begin gian chạy thường là O(n+m) if p = t then /* there may be a hit */ s cọng với thời gian đòi hỏi để if P[1 m] = T[s+1 s+m] then kiểm tra lại các sự khớp trùng Print “Pattern occurs with shift “s; giả. if s < n – m then ts+1: = (d(ts –T[s + 1]h) + T[s+m+1])mod q end end 35
  26. Vài ghi nhận về chiến lược biến thể-để-trị ◼ Cây AVL là cây tìm kiếm nhị phân mà luôn luôn được làm cho cân bằng. ❑ Sự cân bằng này được duy trì bằng 4 phép quay (rotation). ❑ Tất cả các thao tác trên cây AVL đều có độ phức tạp O(nlgn), loại trừ được trường hợp xấu nhất của cây tìm kiếm nhị phân. ◼ Cây AVL và giải thuật loại trừ Gauss là những thí dụ của biến thể-để-trị theo kiểu “đơn giản hóa thể hiện”. ◼ Heapsort, giải thuật Horner và giải thuật Rabin- Karp là những thí dụ của biến thể-để-trị theo kiểu “biến đổi cách biểu diễn” 36