Đặc biệt cảm ơn Justin Drake, Francesco, Hsiao-wei Wang, @antonttc và Georgios Konstantopoulos.
Ban đầu, có hai chiến lược mở rộng quy mô trong lộ trình của ETH. Một (xem một bài báo trước đó từ năm 2015) là “Phân mảnh” (sharding): mỗi Nút chỉ cần xác minh và lưu trữ một phần nhỏ các giao dịch, thay vì tất cả các giao dịch trong chuỗi. Bất kỳ mạng ngang hàng nào khác (ví dụ: BitTorrent) đều hoạt động theo cách này, vì vậy chúng tôi chắc chắn có thể làm cho blockchain hoạt động theo cùng một cách. Cái còn lại là Layer2 giao thức: các mạng này sẽ được đặt trên đỉnh của ô vuông ETH, cho phép chúng được hưởng lợi đầy đủ từ bảo mật của chúng trong khi vẫn giữ hầu hết dữ liệu và tính toán bên ngoài Chuỗi chính. Layer2 giao thức đề cập đến các kênh trạng thái vào năm 2015, Plasma vào năm 2017 và sau đó là Rollup vào năm 2019. Rollups mạnh hơn các kênh trạng thái hoặc plasma, nhưng chúng đòi hỏi nhiều băng thông dữ liệu trên chuỗi. May mắn thay, đến năm 2019, nghiên cứu Phân mảnh đã giải quyết được vấn đề xác minh “tính sẵn có của dữ liệu” trên quy mô lớn. Kết quả là, hai con đường đã hợp nhất và chúng tôi đã có một lộ trình tập trung vào Rollup vẫn là chiến lược mở rộng quy mô của ETHFANG ngày nay.
The Surge, bản đồ tuyến đường năm 2023
Bản đồ điểm tập trung vào Rollup đã đưa ra một sự phân chia đơn giản: ETH L1 tập trung vào việc trở thành một tầng cơ sở mạnh mẽ và Phi tập trung, trong khi L2 đảm nhận nhiệm vụ mở rộng hệ sinh thái. Mô hình này phổ biến trong xã hội: sự tồn tại của hệ thống tòa án (L1) không phải là để đạt được tốc độ cực cao và hiệu quả, mà là để bảo vệ hợp đồng và quyền sở hữu, trong khi người sáng lập (L2) phải xây dựng trên nền tảng vững chắc này, dẫn dắt nhân loại tiến tới sao Hỏa (cả về nghĩa đen lẫn nghĩa bóng).
Trong năm nay, đường lối tập trung vào Rollup đã đạt được những thành tựu quan trọng: với sự ra đời của các blob EIP-4844, băng thông dữ liệu của ETH L1 đã tăng đáng kể, nhiều Máy ảo Ethereum (EVM) Rollup đã bước vào giai đoạn đầu tiên. Mỗi L2 tồn tại như một “Phân mảnh” có các quy tắc và logic nội bộ riêng, và sự đa dạng và phong phú trong cách thực hiện Phân mảnh hiện nay đã trở thành hiện thực. Tuy nhiên, như chúng ta đã thấy, việc theo đuổi con đường này cũng đối diện với những thách thức độc đáo. Do đó, nhiệm vụ hiện tại của chúng ta là hoàn thành đường lối tập trung vào Rollup và giải quyết những vấn đề này, đồng thời duy trì tính ổn định và tính Phi tập trung đặc biệt của ETH L1.
The Surge: Mục tiêu chính
Trong tương lai, Ethereum có thể đạt được hơn 100.000 TPS thông qua L2.
2、保持 L1 的Phi tập trung和鲁棒性;
Ít nhất một số L2 hoàn toàn thừa hưởng các thuộc tính cốt lõi của Ethereum (Không đáng tin cậy, mở, chống kiểm duyệt);
Ethereum nên cảm nhận như một hệ sinh thái thống nhất, chứ không phải là 34 chuỗi khối khác nhau.
Nội dung chương này
Paradox of Scalability Triangle
Tiến bộ thêm về việc sử dụng mẫu lấy mẫu sẵn sàng dữ liệu
Nén dữ liệu
Plasma Tổng quát
Hệ thống chứng minh L2 trưởng thành
Cải thiện tính tương tác chéo L2
Gia hạn thực hiện trên L1
Dilemma tam giác mở rộng
Lỗ paradox tam giác mở rộng là một ý tưởng được đưa ra vào năm 2017, nó cho rằng có sự mâu thuẫn giữa ba đặc tính của blockchain: Phi tập trung (cụ thể hơn: chi phí thấp để vận hành Nút), khả năng mở rộng (xử lý số lượng giao dịch lớn) và an toàn (kẻ tấn công cần phá hủy một phần lớn các Nút trong mạng mới có thể khiến một giao dịch thất bại).
Điều đáng chú ý là, Paradox tam giác không phải là một định lý, và bài viết giới thiệu Paradox tam giác cũng không đi kèm với chứng minh toán học. Nó thực sự đưa ra một lập luận toán học theo cách tạo cảm hứng: nếu một Nút thân thiện với Phi tập trung (ví dụ: laptop tiêu dùng) có thể xác minh N giao dịch mỗi giây, và bạn có một chuỗi xử lý k*N giao dịch mỗi giây, thì (i) mỗi giao dịch chỉ có thể được xem bởi 1/k Nút, điều này có nghĩa là kẻ tấn công chỉ cần phá hỏng một số ít Nút để thực hiện một giao dịch độc hại, hoặc (ii) Nút của bạn sẽ trở nên mạnh mẽ, trong khi chuỗi của bạn không sẽ Phi tập trung. Mục đích của bài viết này không phải là chứng minh việc phá vỡ Paradox tam giác là không thể; ngược lại, nó nhằm chỉ ra rằng việc phá vỡ Paradox tam giác là khó khăn, nó cần phải thoát ra khỏi khung tư duy ngầm định của lập luận đó một cách nào đó.
Trong nhiều năm qua, một số chuỗi có hiệu suất cao đã tuyên bố giải quyết được mâu thuẫn tam yếu mà không thay đổi cấu trúc căn bản, thường thông qua việc tối ưu hóa Nút bằng kỹ thuật kỹ thuật phần mềm. Điều này luôn luôn gây hiểu lầm, việc chạy Nút on-chain này khó hơn nhiều so với chạy Nút trên Ethereum. Bài viết này sẽ khám phá lý do tại sao và tại sao chỉ có kỹ thuật phần mềm L1 khách hàng không thể mở rộng Ethereum?
Tuy nhiên, sự kết hợp giữa việc lấy mẫu tính sẵn dữ liệu và SNARKs thực sự giải quyết được nghịch lý tam giác: nó cho phép khách hàng xác minh một số lượng nhất định dữ liệu có sẵn và một số lượng nhất định bước tính toán được thực hiện đúng mà không cần tải xuống một lượng dữ liệu lớn và thực hiện một lượng tính toán rất ít. SNARKs không đòi hỏi sự tin tưởng. Lấy mẫu tính sẵn dữ liệu có một mô hình tin cậy few-of-N tinh tế, nhưng nó giữ lại các đặc điểm cơ bản của một chuỗi không mở rộng, tức là thậm chí một cuộc tấn công 51% cũng không thể bắt buộc mạng chấp nhận các khối xấu.
Một cách khác để giải quyết khó khăn ba là kiến trúc Plasma, sử dụng công nghệ tinh tế để chuyển trách nhiệm giám sát sự khả dụng dữ liệu cho người dùng một cách khích lệ và tương thích. Trong giai đoạn 2017-2019, khi chúng ta chỉ có bằng chứng gian lận như một phương tiện để mở rộng khả năng tính toán, Plasma bị hạn chế về mặt an ninh, nhưng với sự phổ biến của SNARKs (bằng chứng không biết rõ ràng, rõ ràng, không tương tác), kiến trúc Plasma trở nên khả thi hơn đối với các tình huống sử dụng rộng rãi hơn so với trước đây.
Tiến triển thêm về lấy mẫu sẵn sàng dữ liệu
Chúng tôi đang giải quyết vấn đề gì?
Vào ngày 13 tháng 3 năm 2024, khi Dencun được nâng cấp và ra mắt, mỗi slot trên blockchain của Etherum có khoảng 3 blob có dung lượng khoảng 125 kB trong khoảng thời gian 12 giây, hoặc băng thông dữ liệu có sẵn cho mỗi slot là khoảng 375 kB. Giả sử dữ liệu giao dịch được xuất bản trực tiếp trên chain, thì giao dịch chuyển tiền ERC20 có khoảng 180 byte, vì vậy TPS tối đa của Rollup trên nền tảng Etherum là: 375000 / 12 / 180 = 173,6 TPS.
Nếu chúng ta thêm calldata từ Ethereum (giá trị tối đa lý thuyết: mỗi khe 30 triệu Gas / mỗi byte 16 gas = mỗi khe 1.875.000 byte), thì tốc độ giao dịch sẽ tăng lên 607 TPS. Sử dụng PeerDAS, số lượng blob có thể tăng lên 8-16, điều này sẽ cung cấp 463-926 TPS cho calldata.
Đây là một bước tiến lớn đối với ETH L1, nhưng vẫn chưa đủ. Chúng tôi muốn có thêm tính mở rộng. Mục tiêu trung hạn của chúng tôi là mỗi khe cắm 16 MB, nếu kết hợp với cải tiến nén dữ liệu Rollup, sẽ mang lại ~58000 TPS.
Nó là gì? Làm thế nào để nó hoạt động?
PeerDAS là một triển khai đơn giản của “1D sampling”. Trong Ethereum, mỗi blob là một đa thức bậc 4096 trên trường số nguyên tố 253 bit. Chúng tôi phát sóng các phần chia của đa thức, trong đó mỗi phần chứa 16 giá trị đánh giá từ 16 tọa độ liền kề trong tổng cộng 8192 tọa độ. Trong số 8192 giá trị đánh giá này, bất kỳ 4096 giá trị (tùy thuộc vào tham số hiện tại được đề xuất: 64 giá trị từ 128 mẫu có thể có) có thể khôi phục lại blob.
Công nghệ PeerDAS hoạt động bằng cách cho phép mỗi client lắng nghe một số mạng con, trong đó mạng con thứ i phát sóng bất kỳ mẫu blob thứ i nào và yêu cầu các blob trên các mạng con khác mà nó cần thông qua việc hỏi các peer trên mạng P2P toàn cầu (những người lắng nghe các mạng con khác nhau). Phiên bản thận trọng hơn của SubnetDAS chỉ sử dụng cơ chế mạng con mà không có sự hỏi từ lớp peer. Đề xuất hiện tại là để các Nút tham gia Bằng chứng về cổ phần sử dụng SubnetDAS, trong khi các Nút khác (tức là khách hàng) sử dụng PeerDAS.
Về mặt lý thuyết, chúng ta có thể mở rộng quy mô “lấy mẫu 1D” lên khá lớn: nếu chúng ta tăng số lượng blob tối đa lên 256 (với mục tiêu là 128), thì chúng ta có thể đạt được mục tiêu 16 MB và 16 mẫu trên mỗi Nút trong lấy mẫu tính khả dụng của dữ liệu * 128 blob trên mỗi blob 512 byte mỗi mẫu = 1 MB băng thông dữ liệu trên mỗi khe. Điều này hầu như không nằm trong khả năng chịu đựng của chúng tôi: nó có thể thực hiện được, nhưng điều đó có nghĩa là các máy khách bị hạn chế về băng thông không thể lấy mẫu. Chúng ta có thể tối ưu hóa điều này ở một mức độ nào đó bằng cách giảm số lượng blob và tăng kích thước blob, nhưng điều này làm cho việc xây dựng lại tốn kém hơn.
Do đó, chúng tôi cuối cùng muốn tiến xa hơn bằng cách thực hiện mẫu 2D (2D sampling), phương pháp này không chỉ ngẫu nhiên mẫu trong blob mà còn ngẫu nhiên mẫu giữa các blob. Sử dụng tính chất tuyến tính của cam kết KZG, mở rộng tập hợp blob trong mộtKhối bằng một tập hợp blob ảo mới, những blob ảo này mã hóa dư thừa thông tin giống nhau.
Do đó, cuối cùng chúng tôi muốn đi sâu hơn và thực hiện mẫu 2D, không chỉ trong blob mà còn giữa các blob một cách ngẫu nhiên. Thuộc tính tuyến tính mà KZG cam kết được sử dụng để mở rộng tập hợp các blob trong một Khối, bao gồm danh sách blob ảo mới mã hóa dư thừa thông tin tương tự.
Mẫu 2D. Nguồn dữ liệu: a16z crypto
Quan trọng là, mở rộng cam kết tính toán không cần có blob, do đó giải pháp này thân thiện với xây dựng Khối phân tán. Nút xây dựng thực tế của Khối chỉ cần có cam kết KZG blob và họ có thể phụ thuộc vào việc lấy mẫu tính sẵn dữ liệu (DAS) để xác minh tính sẵn sàng của khối dữ liệu. Mẫu tính sẵn dữ liệu một chiều (1D DAS) cũng thân thiện với xây dựng Khối phân tán.
Có liên kết nào với nghiên cứu hiện tại không?
Bài viết gốc giới thiệu về tính khả dụng của dữ liệu (2018):
2.Bài viết theo dõi:
Về bài viết giải thích về DAS, mô hình:
Khả năng sử dụng 2D với cam kết KZG:
PeerDAS trên 5.ethresear.ch: Và bài báo:
6.EIP-7594:
SubnetDAS trên ethresear.ch:
Sự khác biệt tinh tế về khả năng khôi phục trong quá trình lấy mẫu 8.2D:
Còn cần làm gì nữa? Và còn có những sự cân nhắc nào khác?
Tiếp theo là hoàn thiện và triển khai PeerDAS. Sau đó, tăng số lượng blob trên PeerDAS một cách liên tục, đồng thời quan sát mạng và cải thiện phần mềm để đảm bảo an toàn, đây là một quá trình tiến triển. Đồng thời, chúng tôi hy vọng có nhiều công việc học thuật hơn để quy định PeerDAS và các phiên bản DAS khác cũng như tương tác với quy tắc lựa chọn fork và các vấn đề bảo mật khác.
Xa hơn nữa, chúng ta cần phải làm nhiều việc hơn để xác định phiên bản lý tưởng của DAS 2D và chứng minh các đặc tính an toàn của nó. Chúng tôi cũng hy vọng cuối cùng sẽ chuyển từ KZG sang một giải pháp thay thế an toàn lượng tử mà không yêu cầu thiết lập đáng tin cậy. Tại thời điểm này, vẫn chưa rõ ứng cử viên nào thân thiện với các bản dựng được phân phối. Ngay cả việc sử dụng các kỹ thuật “brute force” đắt tiền, tức là STARK đệ quy để tạo ra bằng chứng hợp lệ để tái tạo các hàng và cột, là không đủ, bởi vì trong khi về mặt kỹ thuật, STARK có kích thước của hàm băm O (log (n) * log (log (n)) (sử dụng STIR), STARK thực sự lớn gần bằng toàn bộ blob.
Con đường thực tế dài hạn mà tôi cho là:
Thực hiện 2D DAS lý tưởng;
Tiếp tục sử dụng 1D DAS, hy sinh hiệu suất băng thông mẫu để đơn giản hóa và tăng tính ổn định, và chấp nhận giới hạn dữ liệu thấp hơn.
(Hard pivot) Từ bỏ DA, hoàn toàn chấp nhận Plasma là kiến trúc Layer2 chính của chúng tôi theo dõi.
Vui lòng lưu ý rằng sự lựa chọn này vẫn tồn tại ngay cả khi chúng tôi quyết định mở rộng trực tiếp trên tầng L1. Điều này bởi vì nếu tầng L1 phải xử lý một lượng lớn TPS, khối L1 sẽ trở nên rất lớn và các máy khách sẽ muốn có một cách hiệu quả để xác minh tính chính xác của chúng. Do đó, chúng tôi sẽ phải sử dụng công nghệ tương tự với Rollup (như ZK-EVM và DAS) trên tầng L1.
Làm thế nào để tương tác với phần còn lại của bản đồ con đường?
Nếu thực hiện nén dữ liệu, nhu cầu của 2D DAS sẽ giảm đi, hoặc ít nhất là Trễ, nếu Plasma được sử dụng rộng rãi, nhu cầu sẽ giảm đi thêm. DAS cũng đặt ra thách thức về giao thức và cơ chế xây dựng Khối phân tán: mặc dù lý thuyết DAS thân thiện với việc tái xây dựng phân tán, nhưng điều này cần kết hợp với đề xuất danh sách inclusion và cơ chế chọn fork xung quanh nó trong thực tế.
Nén dữ liệu
Chúng tôi đang giải quyết vấn đề gì?
Mỗi giao dịch trong Rollup đều sẽ chiếm một lượng dữ liệu on-chain lớn: việc chuyển đổi ERC20 tốn khoảng 180 byte. Ngay cả khi có mẫu sẵn có lý tưởng, điều này cũng hạn chế tính mở rộng của giao thức Layer. Mỗi khe 16 MB, chúng ta có:
16000000 / 12 / 180 = 7407 TPS
Nếu chúng ta không chỉ có thể giải quyết vấn đề của tử số mà còn có thể giải quyết vấn đề của mẫu số, để mỗi giao dịch trong Rollup chiếm ít byte hơn trong chuỗi, điều đó sẽ như thế nào?
Nó là gì và hoạt động như thế nào?
The best explanation in my opinion is this picture from two years ago:
Trong việc nén byte không, chúng tôi sử dụng hai byte để thay thế mỗi chuỗi byte không dài, để biểu thị có bao nhiêu byte không. Hơn nữa, chúng tôi đã tận dụng các thuộc tính cụ thể của giao dịch:
Tích hợp chữ ký: Chúng tôi chuyển từ chữ ký ECDSA sang chữ ký BLS. Đặc tính của chữ ký BLS là nhiều chữ ký có thể kết hợp thành một chữ ký duy nhất, chứng minh được tính hiệu lực của tất cả chữ ký ban đầu. Ở tầng L1, do chi phí tính toán xác minh cao ngay cả khi tập hợp, nên không xem xét việc sử dụng chữ ký BLS. Tuy nhiên, trong môi trường ít dữ liệu như L2, việc sử dụng chữ ký BLS là có ý nghĩa. Đặc tính tập hợp của ERC-4337 cung cấp một con đường để thực hiện chức năng này.
Thay thế Địa chỉ bằng con trỏ: Nếu đã sử dụng một Địa chỉ trước đó, chúng ta có thể thay thế 20 byte Địa chỉ bằng con trỏ 4 byte trỏ đến vị trí trong lịch sử.
Tự tuần tự hóa giá trị giao dịch - Hầu hết các giá trị giao dịch có số chữ số rất ít, ví dụ, 0.25 ETH được biểu diễn như 250,000,000,000,000,000 wei. Phí giao dịch cơ bản tối đa và phí ưu tiên cũng tương tự. Do đó, chúng ta có thể sử dụng định dạng số thập phân tùy chỉnh để biểu diễn hầu hết các giá trị tiền tệ.
Có liên kết nào với nghiên cứu hiện tại không?
Khám phá sequence.xyz:
2.L2 Calldata tối ưu hợp đồng:
Dựa trên sự khác biệt về trạng thái phát hành của rollups bằng chứng hợp lệ (còn được gọi là ZK rollups) thay vì giao dịch:
BLS Ví tiền - Thực hiện BLS tổng hợp thông qua ERC-4337:
Cần làm gì tiếp theo và có những sự cân nhắc nào?
Tiếp theo, điều quan trọng là thực hiện thực tế các phương án đã nêu. Các yếu tố chính để cân nhắc bao gồm:
1、Chuyển sang chữ ký BLS đòi hỏi nỗ lực lớn và có thể Thả tương thích với chip cứng tin cậy có khả năng tăng cường tính an toàn. Có thể sử dụng gói ZK-SNARK ký thay thế.
Nén động (ví dụ: thay thế Địa chỉ bằng con trỏ) có thể làm phức tạp mã phía máy khách.
3, việc công bố sự khác biệt trạng thái trên blockchain thay vì qua giao dịch sẽ giảm đi tính khả kiểm tra và làm cho nhiều phần mềm (ví dụ như khám phá blockchain) không thể hoạt động được.
Làm thế nào để tương tác với các phần khác của bản đồ con đường?
Việc áp dụng ERC-4337 và cuối cùng kết hợp các bộ phận của nó vào L2 EVM có thể đẩy nhanh đáng kể việc triển khai công nghệ tổng hợp. Đặt các phần của ERC-4337 trên L1 có thể tăng tốc độ triển khai của nó trên L2.
Plasma Chung
Chúng tôi đang giải quyết vấn đề gì?
Dù sử dụng blob và nén dữ liệu với kích thước 16 MB, 58.000 TPS cũng không đủ để đáp ứng hoàn toàn nhu cầu thanh toán của người tiêu dùng, giao tiếp xã hội phi tập trung hoặc các lĩnh vực có băng thông cao khác, đặc biệt là khi chúng ta bắt đầu xem xét yếu tố riêng tư, điều này có thể làm tăng khả năng mở rộng thêm 3-8 lần. Đối với các trường hợp ứng dụng có khối lượng lớn, giá trị thấp, một lựa chọn hiện tại là sử dụng Validium, nơi dữ liệu được lưu trữ off-chain và áp dụng một mô hình an ninh thú vị: các nhà điều hành không thể ăn cắp tiền của người dùng, nhưng họ có thể tạm thời hoặc vĩnh viễn đóng băng tài sản của tất cả người dùng. Nhưng chúng ta có thể làm tốt hơn.
Nó là gì, làm thế nào hoạt động?
Plasma là một giải pháp mở rộng, liên quan đến việc một nhà khai thác đưa Raft lên off-chain và đặt các gốc Merkle của các Raft này lên on-chain (khác với Rollup, Rollup sẽ đặt toàn bộ Raft lên on-chain). Đối với mỗi Raft, nhà khai thác sẽ gửi một nhánh Merkle cho mỗi người dùng để chứng minh sự thay đổi tài sản của người dùng đó hoặc không có sự thay đổi. Người dùng có thể rút tài sản của họ bằng cách cung cấp nhánh Merkle. Quan trọng là nhánh này không cần phải có gốc là trạng thái mới nhất. Do đó, ngay cả khi sẵn có sự cố về khả dụng dữ liệu, người dùng vẫn có thể khôi phục tài sản của họ bằng cách rút trạng thái mới nhất có sẵn của họ. Nếu người dùng gửi một nhánh không hợp lệ (ví dụ: rút tài sản họ đã gửi cho người khác hoặc nhà khai thác tự tạo ra một tài sản từ không), thì có thể xác định sự sở hữu hợp lệ của tài sản thông qua cơ chế thách thức on-chain.
Sơ đồ Plasma Cash Chain. Các giao dịch chi tiêu đồng tiền i được đưa vào vị trí thứ i của cây. Trong ví dụ này, giả sử tất cả các cây trước đó đều hợp lệ, chúng ta biết rằng Eve hiện đang sở hữu Token 1, David sở hữu Token 4, George sở hữu Token 6.
Phiên bản Plasma ban đầu chỉ xử lý các trường hợp thanh toán và không thể mở rộng hiệu quả hơn. Tuy nhiên, nếu chúng ta yêu cầu mỗi gốc đều được xác minh bằng SNARK, thì Plasma sẽ mạnh mẽ hơn nhiều. Mọi trò chơi thách thức đều có thể đơn giản hóa rất nhiều vì chúng ta loại bỏ hầu hết các con đường tiềm năng để các nhà điều hành gian lận. Đồng thời, cũng mở ra các con đường mới, giúp công nghệ Plasma có thể mở rộng sang các loại tài sản rộng lớn hơn. Cuối cùng, trong trường hợp nhà điều hành không gian lận, người dùng có thể rút tiền ngay lập tức mà không cần chờ đợi một tuần thời gian thách thức.
Một phương pháp (không phải là duy nhất) để tạo ra một chuỗi EVM Plasma: sử dụng ZK-SNARK để xây dựng một cây UTXO song song, cây này phản ánh sự thay đổi số dư được thực hiện bởi EVM và xác định ánh xạ duy nhất của ‘Token cùng loại’ tại các thời điểm khác nhau trong lịch sử. Sau đó, có thể xây dựng cấu trúc Plasma trên nó.
Một quan điểm then chốt là hệ thống Plasma không cần phải hoàn hảo. Ngay cả khi bạn chỉ có thể bảo vệ một phần của tài sản (ví dụ, chỉ là Token không di chuyển trong tuần qua), bạn cũng đã cải thiện đáng kể tình trạng hiện tại của EVM siêu mở rộng (cụ thể là Validium).
Loại cấu trúc khác là sự kết hợp Plasma/Rollup, ví dụ như Intmax. Các cấu trúc này đặt một lượng dữ liệu rất nhỏ của mỗi người dùng lên chuỗi (ví dụ, 5 byte), điều này giúp đạt được một số tính năng nằm giữa Plasma và Rollup: trong trường hợp của Intmax, bạn có thể đạt được sự mở rộng và quyền riêng tư rất cao, mặc dù trong lý thuyết, ngay cả trong dung lượng 16 MB, cũng chỉ giới hạn ở khoảng 16,000,000 / 12 / 5 = 266,667 TPS.
Có những liên kết liên quan nào với nghiên cứu hiện tại?
1.Original Plasma paper:
Plasma Cash:
Luồng tiền Plasma Cash:
4.Intmax (2023):
Vẫn cần làm gì nữa? Có những sự cân nhắc nào?
Nhiệm vụ chính còn lại là triển khai hệ thống Plasma vào ứng dụng thực tế. Như đã đề cập ở trên, Plasma và Validium không phải là một lựa chọn hoặc lựa chọn khác: bất kỳ Validium nào cũng có thể cải thiện tính bảo mật của nó ít nhất một mức độ bằng cách tích hợp các tính năng Plasma vào cơ chế rút tiền của nó. Nghiên cứu tập trung vào việc đạt được các thuộc tính tốt nhất cho EVM (từ yêu cầu tin cậy, chi phí Gas L1 tệ nhất và khả năng chống lại cuộc tấn công DoS), cũng như cấu trúc ứng dụng thay thế cụ thể. Hơn nữa, so với Rollup, Plasma có độ phức tạp về mặt khái niệm cao hơn, điều này đòi hỏi nghiên cứu và xây dựng một khung làm việc chung tốt hơn để giải quyết trực tiếp.
Việc cân nhắc chính với thiết kế Plasma là chúng phụ thuộc nhiều hơn vào các nhà điều hành và khó khăn hơn trong việc thiết lập, mặc dù thiết kế kết hợp Plasma/Rollup thường có thể tránh được điểm yếu này.
Làm thế nào để tương tác với phần còn lại của bản đồ con đường?
Khi giải pháp Plasma hiệu quả hơn, áp lực đối với tính sẵn có dữ liệu hiệu suất cao của L1 cũng nhỏ hơn. Việc di chuyển hoạt động sang L2 cũng có thể giảm áp lực MEV trên L1.
Hệ thống chứng minh L2 trưởng thành
Chúng tôi đang giải quyết vấn đề gì?
Hiện tại, hầu hết các Rollups chưa thực sự Không đáng tin cậy. Có một ủy ban an toàn có khả năng ghi đè (lạc quan hoặc hợp lệ) để chứng minh hành vi của hệ thống. Trong một số trường hợp, hệ thống chứng thực thậm chí không hoạt động, hoặc thậm chí nếu có, nó chỉ có chức năng “tư vấn”. Các bản tổng hợp hiện đại bao gồm: (i) một số bản tổng hợp dành riêng cho ứng dụng của Không đáng tin cậy, chẳng hạn như Nhiên liệu; (ii) Tại thời điểm viết bài, Optimism và Arbitrum là hai bản tổng hợp EVM đầy đủ đã đạt được các cột mốc không tin cậy một phần được gọi là “Giai đoạn 1”. Lý do Rollup không đạt được nhiều tiến bộ hơn là vì lo ngại về lỗi trong mã. Chúng tôi cần những bản tổng hợp không tin cậy, vì vậy chúng tôi phải đối mặt và giải quyết vấn đề này trực tiếp.
Nó là gì, làm thế nào hoạt động?
Đầu tiên, hãy xem lại hệ thống ‘stage’ được giới thiệu ban đầu trong bài viết này.
阶段 0:Người dùng phải có thể chạy Nút và đồng bộ chuỗi. Nếu xác minh là hoàn toàn đáng tin cậy / tập trung, cũng không sao.
Giai đoạn 1: Phải có một hệ thống chứng minh (không cần tin cậy) để đảm bảo chỉ có giao dịch hợp lệ mới được chấp nhận. Cho phép một ủy ban an ninh có thể lật đổ hệ thống chứng minh, nhưng phải có ngưỡng bỏ phiếu 75%. Ngoài ra, phần chặn quorum-blocking trong ủy ban (tức là 26%+) phải ở ngoài công ty chính xây dựng Rollup. Cho phép sử dụng cơ chế nâng cấp yếu hơn (ví dụ như DAO), nhưng nó phải có Trễ đủ lâu, nếu nó phê duyệt nâng cấp độc hại, người dùng có thể rút tiền của họ trước khi tiền của họ được kích hoạt.
Giai đoạn 2: Phải có một hệ thống chứng minh (không cần tin tưởng) để đảm bảo chỉ có giao dịch hợp lệ mới được chấp nhận. Ủy ban An ninh chỉ cho phép can thiệp khi có lỗi có thể chứng minh trong mã nguồn, ví dụ như nếu hai hệ thống chứng minh dư thừa không nhất quán với nhau, hoặc nếu một hệ thống chứng minh chấp nhận hai trạng thái post khác nhau của cùng một Khối (hoặc không chấp nhận bất kỳ nội dung nào trong một khoảng thời gian đủ lâu, ví dụ một tuần). Cho phép sử dụng cơ chế nâng cấp, nhưng phải có Trễ dài.
Mục tiêu của chúng tôi là đạt được giai đoạn 2. Thách thức chính của giai đoạn 2 là có đủ độ tin cậy để chứng minh hệ thống thực sự đáng tin cậy. Có hai phương pháp chính để thực hiện điều này:
Xác minh chính thức: Chúng ta có thể sử dụng toán học hiện đại và công nghệ tính toán để chứng minh (tích cực và hợp lệ) hệ thống chấp nhận chỉ các Khối tuân thủ theo quy định của EVM. Các công nghệ này đã tồn tại trong vài chục năm, nhưng sự tiến bộ gần đây (như Lean 4) đã làm cho chúng trở nên càng thực tế hơn, và sự tiến bộ trong việc chứng minh được hỗ trợ bởi trí tuệ nhân tạo có thể làm tăng tốc thêm cho xu hướng này.
Đa chứng minh (Multi-provers): Tạo nhiều hệ thống chứng minh và đầu tư tiền vào những hệ thống chứng minh này cùng với ủy ban an ninh (hoặc các công cụ nhỏ khác có giả định tin tưởng như TEE). Nếu các hệ thống chứng minh đồng ý, ủy ban an ninh sẽ không có quyền; nếu chúng không đồng ý, ủy ban an ninh chỉ có thể lựa chọn giữa các hệ thống này, và không thể đưa ra câu trả lời một mình.
Chương trình hình vẽ của người chứng minh nhiều, kết hợp một hệ thống chứng minh lạc quan, một hệ thống bằng chứng hợp lệ và một ủy ban an toàn.
Có liên kết nào với nghiên cứu hiện tại không?
Ngữ nghĩa EVM K (công việc xác minh hình thức từ năm 2017):
Bài diễn thuyết về ý tưởng chứng minh nhiều (2022):
Kế hoạch sử dụng chứng minh nhiều lớp:
Vẫn cần làm gì nữa? Có những sự cân nhắc nào?
Đối với Xác minh chính thức, khối lượng công việc rất lớn. Chúng ta cần tạo ra một phiên bản xác minh chính thức toàn bộ SNARK của EVM. Đây là một dự án cực kỳ phức tạp, mặc dù chúng ta đã bắt đầu tiến hành. Có một mẹo có thể giúp đơn giản hóa nhiều công việc này: chúng ta có thể tạo ra một bằng chứng xác minh chính thức cho một Máy ảo tối giản (ví dụ: RISC-V hoặc Cairo), sau đó triển khai EVM trong Máy ảo tối giản đó (và chứng minh hình thức rằng nó tương đương với các quy định khác của Máy ảo ETH).
Đối với multi-proof, còn hai phần chính chưa hoàn thành. Đầu tiên, chúng ta cần đủ tin cậy vào ít nhất hai hệ thống chứng minh khác nhau, đảm bảo rằng chúng đều an toàn đủ và đảm bảo rằng nếu chúng gặp vấn đề, thì các vấn đề này nên khác nhau và không liên quan (do đó chúng sẽ không đồng thời gặp vấn đề). Thứ hai, chúng ta cần tin tưởng rất cao vào logic cơ bản của hệ thống chứng minh hợp nhất. Mã này phải ít hơn nhiều. Có một số cách để làm cho nó rất nhỏ, chỉ cần lưu trữ tiền trong một hợp đồng multi-sign an toàn (Safe multisig) được đại diện bởi các hệ thống chứng minh, nhưng điều này sẽ tăng chi phí Gas on-chain. Chúng ta cần tìm một sự cân bằng giữa hiệu suất và an toàn.
Làm thế nào để tương tác với phần còn lại của bản đồ con đường?
Di chuyển hoạt động đến L2 có thể giảm áp lực MEV trên L1.
Cải tiến tương tác giữa L2 khác nhau
Chúng tôi đang giải quyết vấn đề gì?
Một trong những thách thức chính mà hệ sinh thái L2 đang đối mặt hiện nay là người dùng gặp khó khăn khi điều hướng trong đó. Ngoài ra, cách đơn giản nhất thường lại đưa ra giả định về sự tin cậy: chuỗi cross-interact, RPC client, v.v. Chúng ta cần để việc sử dụng hệ sinh thái L2 cảm giác như đang sử dụng một hệ sinh thái Ethereum thống nhất.
Nó là gì? Làm thế nào nó hoạt động?
Cải tiến tương tác L2 chéo có nhiều loại. Lý thuyết, ETH Rollup trung tâm làm việc với Phân mảnh L1 thực thi là một điều. Hệ sinh thái L2 hiện tại của ETH Blockchain vẫn còn những hạn chế so với trạng thái lý tưởng trong thực tế:
1、Địa chỉ của chuỗi cụ thể: Địa chỉ nên bao gồm thông tin chuỗi (L1, Optimism, Arbitrum…). Một khi điều này được thực hiện, quá trình gửi qua L2 có thể được thực hiện đơn giản bằng cách đặt Địa chỉ vào trường ‘Gửi’, lúc này Ví tiền có thể xử lý tự động cách gửi (bao gồm cả việc sử dụng giao thức tương tác chuỗi).
Yêu cầu thanh toán trên chuỗi cụ thể: Nên dễ dàng và chuẩn hóa để tạo ra thông điệp có dạng ‘Gửi X đại diện loại Y cho tôi trên chuỗi Z’. Có hai tình huống chính: (i) thanh toán giữa người và người hoặc giữa người và dịch vụ của nhà cung cấp; (ii) yêu cầu tài chính từ DApp.
3, trao đổi và thanh toán gas chuỗi chéo: phải có một giao thức mở chuẩn hóa để diễn đạt các hoạt động trao đổi và thanh toán gas chuỗi chéo như “Tôi sẽ gửi 1 Ether cho người gửi 0,9999 Ether trên Arbitrum (trên Optimism)”, và “Tôi sẽ gửi 0,0001 Ether cho người chứa giao dịch này trên Arbitrum (trên Optimism)”. ERC-7683 là một sự cố gắng cho trường hợp đầu tiên, trong khi RIP-7755 là một sự cố gắng cho trường hợp thứ hai, mặc dù cả hai đều có phạm vi ứng dụng rộng hơn các trường hợp cụ thể này.
4、khách hàng ánh sáng:Người dùng cần có thể xác minh thực tế rằng họ đang tương tác với chuỗi mạng, chứ không chỉ tin tưởng vào nhà cung cấp RPC. Helios của a16z crypto có thể làm được điều này (đối với ETH chính), nhưng chúng ta cần mở rộng tính không tin cậy này lên L2. ERC-3668 (CCIP-read) là một chiến lược để đạt được mục tiêu này.
Làm thế nào để cập nhật xem nhật ký tiêu đề Ethereum của khách hàng ánh sáng. Sau khi có nhật ký tiêu đề, bạn có thể sử dụng Chứng chỉ Merkle để xác minh bất kỳ đối tượng trạng thái nào. Một khi bạn có đối tượng trạng thái L1 chính xác, bạn có thể sử dụng Chứng chỉ Merkle (nếu bạn muốn kiểm tra trước khi xác nhận, bạn cũng có thể sử dụng chữ ký) để xác minh bất kỳ đối tượng trạng thái nào trên L2. Helios đã thực hiện điều đó cho phần đầu. Mở rộng nó đến phần sau là một thử thách chuẩn hóa.
Keystore Ví tiền: Hiện nay, để cập nhật Chìa khoá bảo mật của Hợp đồng thông minh Ví tiền mà bạn muốn kiểm soát, bạn phải cập nhật trên tất cả các chuỗi mà Ví tiền đó tồn tại. Keystore Ví tiền là một công nghệ cho phép Chìa khoá bảo mật chỉ tồn tại ở một nơi duy nhất (entweder auf L1 oder möglicherweise in der Zukunft auf L2) và sau đó bất kỳ L2 nào có bản sao của Ví tiền đó đều có thể đọc Chìa khoá bảo mật từ đó. Điều này có nghĩa là chỉ cần cập nhật một lần. Để tăng hiệu suất, Keystore Ví tiền yêu cầu L2 có một cách tiêu chuẩn để đọc thông tin từ L1 mà không tốn phí; có hai đề xuất cho điều này, lần lượt là L1SLOAD và REMOTESTATICCALL.
Nguyên lý hoạt động của Ví tiền Keystore
Một khái niệm cấp tiến hơn về “Shared Token Bridge”: Hãy tưởng tượng một thế giới nơi tất cả L2 là một Rollup bằng chứng hợp lệ và mỗi vị trí được gửi đến ETH Workshop. Ngay cả trong một thế giới như vậy, để chuyển tài sản từ L2 này sang L2 khác ở trạng thái bản địa, việc rút tiền và gửi tiền vẫn được yêu cầu, điều này đòi hỏi phải trả một khoản phí gas L1 đáng kể. Một cách để giải quyết vấn đề này là tạo ra một bản tổng hợp tối giản, được chia sẻ có chức năng duy nhất là duy trì L2 nào sở hữu từng loại mã thông báo và mỗi loại có bao nhiêu số dư và cho phép các số dư đó được cập nhật hàng loạt thông qua một loạt các hoạt động gửi chéo L2 do bất kỳ L2 nào khởi xướng. Điều này sẽ giúp bạn có thể chuyển qua L2 mà không phải trả phí gas L1 cho mỗi lần chuyển và không cần sử dụng các công nghệ dựa trên Thanh khoản như ERC-7683.
Tính toàn diện về tổ hợp: Cho phép việc gọi đồng bộ xảy ra giữa một L2 cụ thể và L1 hoặc giữa nhiều L2 khác nhau. Điều này giúp nâng cao hiệu suất tài chính của giao thức Tài chính phi tập trung. Trong trường hợp đầu tiên, việc này có thể được thực hiện mà không cần bất kỳ sự phối hợp chéo L2 nào; trong trường hợp thứ hai, cần có việc chia sẻ thứ tự. Công nghệ dựa trên Rollup tự động áp dụng cho tất cả các công nghệ này.
Có liên kết nào với nghiên cứu hiện tại không?
Địa chỉ chuỗi cụ thể: ERC-3770:
2.ERC-7683:
3.RIP-7755:
4.Scroll keystore Ví tiền设计式样:
Helios:
ERC-3668 (sometimes referred to as CCIP Read):
Đề xuất của Justin Drake về “dựa trên xác nhận trước (được chia sẻ)”:
8.L1SLOAD (RIP-7728):
REMOTESTATICCALL trong Optimism:
AggLayer, bao gồm cả ý tưởng về cầu mã thông tin chia sẻ:
Vẫn cần làm gì nữa? Có những sự cân nhắc nào?
Nhiều ví dụ trên phải đối mặt với một vấn đề nan giải về tiêu chuẩn khi nào nên tiêu chuẩn hóa và lớp nào cần tiêu chuẩn hóa. Nếu bạn chuẩn hóa quá sớm, bạn có thể cố thủ một giải pháp kém. Nếu bạn chuẩn hóa quá muộn, bạn có thể tạo ra sự phân mảnh không cần thiết. Trong một số trường hợp, có một giải pháp ngắn hạn với các thuộc tính yếu hơn dễ thực hiện hơn và một giải pháp dài hạn “cuối cùng đúng” nhưng mất nhiều năm để đạt được.
Những nhiệm vụ này không chỉ là vấn đề kỹ thuật mà chúng còn là vấn đề xã hội (thậm chí có thể là vấn đề chính), cần sự hợp tác của L2 và Ví tiền cũng như L1.
Làm thế nào để tương tác với phần còn lại của bản đồ con đường?
Hầu hết các đề xuất này là các cấu trúc “cấp cao hơn” và do đó có ít tác động đến các cân nhắc cấp L1. Một ngoại lệ là đặt hàng chia sẻ, có tác động đáng kể đến giá trị có thể trích xuất tối đa (MEV).
Mở rộng thực hiện trên L1
Chúng tôi đang giải quyết vấn đề gì?
Nếu L2 trở nên rất có thể mở rộng và thành công, nhưng L1 vẫn chỉ có thể xử lý một lượng khối lượng rất nhỏ, thì Ethereum có thể sẽ gặp nhiều rủi ro:
Tính kinh tế của tài sản ETH sẽ trở nên biến động hơn, do đó sẽ ảnh hưởng đến bảo mật lâu dài của mạng.
2, rất nhiều L2 được hưởng lợi từ việc liên kết chặt chẽ với hệ sinh thái tài chính phát triển mạnh trên L1. Nếu hệ sinh thái này bị suy yếu một cách đáng kể, thì sự động viên để trở thành L2 (thay vì trở thành L1 độc lập) sẽ giảm đi.
3, L2 cần mất thời gian rất lâu để đạt được mức đảm bảo an ninh hoàn toàn giống như L1.
4、Nếu L2 thất bại (ví dụ, do hành vi ác ý hoặc biến mất của nhà cung cấp dịch vụ), người dùng vẫn cần phải khôi phục tài sản của họ thông qua L1. Do đó, L1 cần đủ mạnh mẽ, ít nhất là có thể đôi khi xử lý công việc kết thúc phức tạp và hỗn loạn của L2.
Vì những lý do này, việc mở rộng L1 và đảm bảo rằng nó có thể tiếp tục chứa đựng nhiều hơn và nhiều hơn các trường hợp sử dụng là rất có giá trị.
Nó là gì? Làm thế nào nó hoạt động?
Cách mở rộng đơn giản nhất là tăng giới hạn gas trực tiếp. Tuy nhiên, điều này có thể làm cho L1 trở nên tập trung, từ đó làm suy yếu một tính năng quan trọng khác của ETH: tính đáng tin cậy của lớp cơ sở mạnh mẽ. Mức độ tăng giới hạn gas một cách đơn giản đến đâu là bền vững vẫn còn tranh cãi, và điều này cũng sẽ khác nhau tùy thuộc vào việc triển khai những công nghệ khác nhau để làm cho việc xác minh khối lớn dễ dàng hơn (ví dụ, lịch sử hết hạn, không trạng thái, bằng chứng hợp lệ L1 EVM). Một điều quan trọng khác cần liên tục cải thiện là hiệu suất của phần mềm máy khách ETH, hiệu suất hiện tại cao hơn nhiều so với năm năm trước. Chiến lược tăng giới hạn gas L1 hiệu quả sẽ bao gồm việc tăng tốc sự phát triển của các công nghệ xác minh này.
1.EOF:một định dạng bytecode EVM mới, thân thiện với phân tích tĩnh hơn, có thể thực hiện nhanh hơn. Với những cải tiến hiệu suất này, bytecode EOF có thể thu được phí gas thấp hơn.
Giá gas đa chiều: Đặt các chi phí cơ bản và giới hạn khác nhau cho tính toán, dữ liệu và lưu trữ, có thể tăng khả năng chứa trung bình của ETH L1 mà không tăng tải trọng tối đa (để tránh tạo ra rủi ro bảo mật mới).
Thả các mã hoạt động cụ thể và chi phí Gas đã được biên soạn - Lịch sử cho thấy, để tránh tấn công từ chối dịch vụ, chúng tôi đã tăng chi phí Gas cho một số hoạt động được định giá quá thấp nhiều lần. Một điều có thể làm thêm nữa là, Thả chi phí Gas của các mã hoạt động được định giá quá cao. Ví dụ, phép cộng rẻ hơn phép nhân rất nhiều, nhưng hiện tại chi phí của các mã hoạt động ADD và MUL lại giống nhau. Chúng ta có thể Thả chi phí của ADD, thậm chí là giảm chi phí của các hoạt động đơn giản như PUSH. EOF nhìn chung có thể được tối ưu hóa hơn trong lĩnh vực này.
4.EVM-MAX và SIMD: EVM-MAX là một đề xuất cho phép tính toán số lớn nguyên tự nhiên hiệu quả hơn như một mô-đun độc lập của EVM. Trừ khi có ý định xuất, giá trị tính toán của EVM-MAX chỉ có thể được truy cập bởi các mã hoạt động EVM-MAX khác. Điều này cho phép có không gian lớn hơn để tối ưu hóa việc lưu trữ các giá trị này. SIMD (single instruction multiple data) là một đề xuất cho phép thực hiện hiệu quả cùng một chỉ thị đối với mảng giá trị. Cả hai cùng có thể tạo ra một bộ xử lý phụ mạnh mẽ bên cạnh EVM, có thể được sử dụng để thực hiện mã hóa hiệu quả hơn. Điều này đặc biệt hữu ích đối với các giao thức bảo mật và hệ thống bảo vệ L2, do đó nó sẽ giúp mở rộng L1 và L2.
Những cải tiến này sẽ được thảo luận kỹ hơn trong các bài viết Splurge sau này.
Cuối cùng, chiến lược thứ ba là Rollups nguyên bản (hoặc rollups được công nhận): Về cơ bản, tạo ra nhiều bản sao EVM chạy song song để tạo ra một mô hình tương đương với những gì Rollup có thể cung cấp, nhưng tích hợp nhiều hơn vào giao thức giao thức.
Có liên kết nào với nghiên cứu hiện tại không?
Lộ trình mở rộng ETH Polynya của Polynya L1:
Định giá Gas đa chiều:
3.EIP-7706:
4.EOF:
5.EVM-MAX:
6.SIMD:
Rollups nguyên bản:
Phỏng vấn Max Resnick về giá trị mở rộng L1:
9.Justin Drake 谈使用 SNARK 和原生 Rollups 进行扩展:
Cần làm gì tiếp theo và có những sự cân nhắc nào?
Mở rộng L1 có ba chiến lược, có thể thực hiện độc lập hoặc song song:
Cải thiện công nghệ (ví dụ: mã nguồn máy khách, máy khách không trạng thái, quá hạn lịch sử) để L1 dễ xác minh hơn, sau đó tăng giới hạn gas.
Thả chi phí hoạt động cụ thể, tăng dung lượng trung bình mà không tăng nguy cơ tình huống tồi nhất;
Rollups nguyên thủy (tức là tạo N bản sao song song của EVM).
Hiểu về những công nghệ khác nhau này, chúng ta sẽ thấy mỗi cái đều có những sự lựa chọn khác nhau. Ví dụ, Rollups gốc có nhiều điểm yếu tương tự như các Rollups thông thường về khả năng kết hợp: bạn không thể gửi một giao dịch duy nhất để thực hiện các hoạt động đồng bộ qua nhiều Rollup giống như bạn có thể làm trong một hợp đồng trên cùng một L1 (hoặc L2). Tăng giới hạn Gas sẽ làm suy yếu những lợi ích khác có thể đạt được thông qua việc xác minh đơn giản hóa trên L1, chẳng hạn như tăng tỷ lệ người dùng xác minh Nút và số lượng người gửi đặt cược solo. Tùy thuộc vào cách triển khai, làm cho các hoạt động cụ thể trong EVM (Máy ảo Ethereum) rẻ hơn có thể làm tăng tính phức tạp của EVM toàn cầu.
Một câu hỏi quan trọng mà bất kỳ lộ trình mở rộng L1 nào cũng cần trả lời là: Tầm nhìn cuối cùng của L1 và L2 lần lượt là gì? Rõ ràng, việc đặt tất cả nội dung trên L1 là điều vô lý: các kịch bản ứng dụng tiềm năng có thể liên quan đến hàng trăm nghìn giao dịch mỗi giây, điều này sẽ làm cho L1 không thể xác minh (trừ khi chúng ta áp dụng phương pháp Rollup nguyên bản). Tuy nhiên, chúng ta thực sự cần một số nguyên tắc hướng dẫn để đảm bảo rằng chúng ta sẽ không rơi vào tình thế như vậy: Giới hạn gas tăng 10 lần, gây tổn hại nghiêm trọng cho sự phi tập trung của Ethereum L1.
Một quan điểm về phân chia lao động giữa L1 và L2
Làm thế nào để tương tác với phần còn lại của bản đồ con đường?
Đưa thêm người dùng vào L1 không chỉ đồng nghĩa với việc nâng cấp khả năng mở rộng, mà còn đồng nghĩa với việc cải thiện các khía cạnh khác của L1. Điều này có nghĩa là nhiều hơn MEV sẽ được giữ lại trên L1 (thay vì chỉ là vấn đề của L2), do đó, nhu cầu xử lý MEV một cách rõ ràng sẽ trở nên cấp bách hơn. Điều này sẽ tăng đáng kể giá trị thời gian khe nhanh trên L1. Đồng thời, điều này cũng phụ thuộc rất nhiều vào việc xác nhận L1 (the Verge) tiến hành một cách thuận lợi.
Đọc thêm: “Vitalik bài viết mới: Ethereum PoS có những cải tiến nào khác? Làm thế nào để thực hiện?”
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Vitalik新文:Ether坊可能的未来,The Surge
Đặc biệt cảm ơn Justin Drake, Francesco, Hsiao-wei Wang, @antonttc và Georgios Konstantopoulos.
Ban đầu, có hai chiến lược mở rộng quy mô trong lộ trình của ETH. Một (xem một bài báo trước đó từ năm 2015) là “Phân mảnh” (sharding): mỗi Nút chỉ cần xác minh và lưu trữ một phần nhỏ các giao dịch, thay vì tất cả các giao dịch trong chuỗi. Bất kỳ mạng ngang hàng nào khác (ví dụ: BitTorrent) đều hoạt động theo cách này, vì vậy chúng tôi chắc chắn có thể làm cho blockchain hoạt động theo cùng một cách. Cái còn lại là Layer2 giao thức: các mạng này sẽ được đặt trên đỉnh của ô vuông ETH, cho phép chúng được hưởng lợi đầy đủ từ bảo mật của chúng trong khi vẫn giữ hầu hết dữ liệu và tính toán bên ngoài Chuỗi chính. Layer2 giao thức đề cập đến các kênh trạng thái vào năm 2015, Plasma vào năm 2017 và sau đó là Rollup vào năm 2019. Rollups mạnh hơn các kênh trạng thái hoặc plasma, nhưng chúng đòi hỏi nhiều băng thông dữ liệu trên chuỗi. May mắn thay, đến năm 2019, nghiên cứu Phân mảnh đã giải quyết được vấn đề xác minh “tính sẵn có của dữ liệu” trên quy mô lớn. Kết quả là, hai con đường đã hợp nhất và chúng tôi đã có một lộ trình tập trung vào Rollup vẫn là chiến lược mở rộng quy mô của ETHFANG ngày nay.
Bản đồ điểm tập trung vào Rollup đã đưa ra một sự phân chia đơn giản: ETH L1 tập trung vào việc trở thành một tầng cơ sở mạnh mẽ và Phi tập trung, trong khi L2 đảm nhận nhiệm vụ mở rộng hệ sinh thái. Mô hình này phổ biến trong xã hội: sự tồn tại của hệ thống tòa án (L1) không phải là để đạt được tốc độ cực cao và hiệu quả, mà là để bảo vệ hợp đồng và quyền sở hữu, trong khi người sáng lập (L2) phải xây dựng trên nền tảng vững chắc này, dẫn dắt nhân loại tiến tới sao Hỏa (cả về nghĩa đen lẫn nghĩa bóng).
Trong năm nay, đường lối tập trung vào Rollup đã đạt được những thành tựu quan trọng: với sự ra đời của các blob EIP-4844, băng thông dữ liệu của ETH L1 đã tăng đáng kể, nhiều Máy ảo Ethereum (EVM) Rollup đã bước vào giai đoạn đầu tiên. Mỗi L2 tồn tại như một “Phân mảnh” có các quy tắc và logic nội bộ riêng, và sự đa dạng và phong phú trong cách thực hiện Phân mảnh hiện nay đã trở thành hiện thực. Tuy nhiên, như chúng ta đã thấy, việc theo đuổi con đường này cũng đối diện với những thách thức độc đáo. Do đó, nhiệm vụ hiện tại của chúng ta là hoàn thành đường lối tập trung vào Rollup và giải quyết những vấn đề này, đồng thời duy trì tính ổn định và tính Phi tập trung đặc biệt của ETH L1.
The Surge: Mục tiêu chính
2、保持 L1 的Phi tập trung和鲁棒性;
Ít nhất một số L2 hoàn toàn thừa hưởng các thuộc tính cốt lõi của Ethereum (Không đáng tin cậy, mở, chống kiểm duyệt);
Ethereum nên cảm nhận như một hệ sinh thái thống nhất, chứ không phải là 34 chuỗi khối khác nhau.
Nội dung chương này
Paradox of Scalability Triangle
Tiến bộ thêm về việc sử dụng mẫu lấy mẫu sẵn sàng dữ liệu
Nén dữ liệu
Plasma Tổng quát
Hệ thống chứng minh L2 trưởng thành
Cải thiện tính tương tác chéo L2
Gia hạn thực hiện trên L1
Dilemma tam giác mở rộng
Lỗ paradox tam giác mở rộng là một ý tưởng được đưa ra vào năm 2017, nó cho rằng có sự mâu thuẫn giữa ba đặc tính của blockchain: Phi tập trung (cụ thể hơn: chi phí thấp để vận hành Nút), khả năng mở rộng (xử lý số lượng giao dịch lớn) và an toàn (kẻ tấn công cần phá hủy một phần lớn các Nút trong mạng mới có thể khiến một giao dịch thất bại).
Điều đáng chú ý là, Paradox tam giác không phải là một định lý, và bài viết giới thiệu Paradox tam giác cũng không đi kèm với chứng minh toán học. Nó thực sự đưa ra một lập luận toán học theo cách tạo cảm hứng: nếu một Nút thân thiện với Phi tập trung (ví dụ: laptop tiêu dùng) có thể xác minh N giao dịch mỗi giây, và bạn có một chuỗi xử lý k*N giao dịch mỗi giây, thì (i) mỗi giao dịch chỉ có thể được xem bởi 1/k Nút, điều này có nghĩa là kẻ tấn công chỉ cần phá hỏng một số ít Nút để thực hiện một giao dịch độc hại, hoặc (ii) Nút của bạn sẽ trở nên mạnh mẽ, trong khi chuỗi của bạn không sẽ Phi tập trung. Mục đích của bài viết này không phải là chứng minh việc phá vỡ Paradox tam giác là không thể; ngược lại, nó nhằm chỉ ra rằng việc phá vỡ Paradox tam giác là khó khăn, nó cần phải thoát ra khỏi khung tư duy ngầm định của lập luận đó một cách nào đó.
Trong nhiều năm qua, một số chuỗi có hiệu suất cao đã tuyên bố giải quyết được mâu thuẫn tam yếu mà không thay đổi cấu trúc căn bản, thường thông qua việc tối ưu hóa Nút bằng kỹ thuật kỹ thuật phần mềm. Điều này luôn luôn gây hiểu lầm, việc chạy Nút on-chain này khó hơn nhiều so với chạy Nút trên Ethereum. Bài viết này sẽ khám phá lý do tại sao và tại sao chỉ có kỹ thuật phần mềm L1 khách hàng không thể mở rộng Ethereum?
Tuy nhiên, sự kết hợp giữa việc lấy mẫu tính sẵn dữ liệu và SNARKs thực sự giải quyết được nghịch lý tam giác: nó cho phép khách hàng xác minh một số lượng nhất định dữ liệu có sẵn và một số lượng nhất định bước tính toán được thực hiện đúng mà không cần tải xuống một lượng dữ liệu lớn và thực hiện một lượng tính toán rất ít. SNARKs không đòi hỏi sự tin tưởng. Lấy mẫu tính sẵn dữ liệu có một mô hình tin cậy few-of-N tinh tế, nhưng nó giữ lại các đặc điểm cơ bản của một chuỗi không mở rộng, tức là thậm chí một cuộc tấn công 51% cũng không thể bắt buộc mạng chấp nhận các khối xấu.
Một cách khác để giải quyết khó khăn ba là kiến trúc Plasma, sử dụng công nghệ tinh tế để chuyển trách nhiệm giám sát sự khả dụng dữ liệu cho người dùng một cách khích lệ và tương thích. Trong giai đoạn 2017-2019, khi chúng ta chỉ có bằng chứng gian lận như một phương tiện để mở rộng khả năng tính toán, Plasma bị hạn chế về mặt an ninh, nhưng với sự phổ biến của SNARKs (bằng chứng không biết rõ ràng, rõ ràng, không tương tác), kiến trúc Plasma trở nên khả thi hơn đối với các tình huống sử dụng rộng rãi hơn so với trước đây.
Tiến triển thêm về lấy mẫu sẵn sàng dữ liệu
Chúng tôi đang giải quyết vấn đề gì?
Vào ngày 13 tháng 3 năm 2024, khi Dencun được nâng cấp và ra mắt, mỗi slot trên blockchain của Etherum có khoảng 3 blob có dung lượng khoảng 125 kB trong khoảng thời gian 12 giây, hoặc băng thông dữ liệu có sẵn cho mỗi slot là khoảng 375 kB. Giả sử dữ liệu giao dịch được xuất bản trực tiếp trên chain, thì giao dịch chuyển tiền ERC20 có khoảng 180 byte, vì vậy TPS tối đa của Rollup trên nền tảng Etherum là: 375000 / 12 / 180 = 173,6 TPS.
Nếu chúng ta thêm calldata từ Ethereum (giá trị tối đa lý thuyết: mỗi khe 30 triệu Gas / mỗi byte 16 gas = mỗi khe 1.875.000 byte), thì tốc độ giao dịch sẽ tăng lên 607 TPS. Sử dụng PeerDAS, số lượng blob có thể tăng lên 8-16, điều này sẽ cung cấp 463-926 TPS cho calldata.
Đây là một bước tiến lớn đối với ETH L1, nhưng vẫn chưa đủ. Chúng tôi muốn có thêm tính mở rộng. Mục tiêu trung hạn của chúng tôi là mỗi khe cắm 16 MB, nếu kết hợp với cải tiến nén dữ liệu Rollup, sẽ mang lại ~58000 TPS.
Nó là gì? Làm thế nào để nó hoạt động?
PeerDAS là một triển khai đơn giản của “1D sampling”. Trong Ethereum, mỗi blob là một đa thức bậc 4096 trên trường số nguyên tố 253 bit. Chúng tôi phát sóng các phần chia của đa thức, trong đó mỗi phần chứa 16 giá trị đánh giá từ 16 tọa độ liền kề trong tổng cộng 8192 tọa độ. Trong số 8192 giá trị đánh giá này, bất kỳ 4096 giá trị (tùy thuộc vào tham số hiện tại được đề xuất: 64 giá trị từ 128 mẫu có thể có) có thể khôi phục lại blob.
Công nghệ PeerDAS hoạt động bằng cách cho phép mỗi client lắng nghe một số mạng con, trong đó mạng con thứ i phát sóng bất kỳ mẫu blob thứ i nào và yêu cầu các blob trên các mạng con khác mà nó cần thông qua việc hỏi các peer trên mạng P2P toàn cầu (những người lắng nghe các mạng con khác nhau). Phiên bản thận trọng hơn của SubnetDAS chỉ sử dụng cơ chế mạng con mà không có sự hỏi từ lớp peer. Đề xuất hiện tại là để các Nút tham gia Bằng chứng về cổ phần sử dụng SubnetDAS, trong khi các Nút khác (tức là khách hàng) sử dụng PeerDAS.
Về mặt lý thuyết, chúng ta có thể mở rộng quy mô “lấy mẫu 1D” lên khá lớn: nếu chúng ta tăng số lượng blob tối đa lên 256 (với mục tiêu là 128), thì chúng ta có thể đạt được mục tiêu 16 MB và 16 mẫu trên mỗi Nút trong lấy mẫu tính khả dụng của dữ liệu * 128 blob trên mỗi blob 512 byte mỗi mẫu = 1 MB băng thông dữ liệu trên mỗi khe. Điều này hầu như không nằm trong khả năng chịu đựng của chúng tôi: nó có thể thực hiện được, nhưng điều đó có nghĩa là các máy khách bị hạn chế về băng thông không thể lấy mẫu. Chúng ta có thể tối ưu hóa điều này ở một mức độ nào đó bằng cách giảm số lượng blob và tăng kích thước blob, nhưng điều này làm cho việc xây dựng lại tốn kém hơn.
Do đó, chúng tôi cuối cùng muốn tiến xa hơn bằng cách thực hiện mẫu 2D (2D sampling), phương pháp này không chỉ ngẫu nhiên mẫu trong blob mà còn ngẫu nhiên mẫu giữa các blob. Sử dụng tính chất tuyến tính của cam kết KZG, mở rộng tập hợp blob trong mộtKhối bằng một tập hợp blob ảo mới, những blob ảo này mã hóa dư thừa thông tin giống nhau.
Do đó, cuối cùng chúng tôi muốn đi sâu hơn và thực hiện mẫu 2D, không chỉ trong blob mà còn giữa các blob một cách ngẫu nhiên. Thuộc tính tuyến tính mà KZG cam kết được sử dụng để mở rộng tập hợp các blob trong một Khối, bao gồm danh sách blob ảo mới mã hóa dư thừa thông tin tương tự.
Quan trọng là, mở rộng cam kết tính toán không cần có blob, do đó giải pháp này thân thiện với xây dựng Khối phân tán. Nút xây dựng thực tế của Khối chỉ cần có cam kết KZG blob và họ có thể phụ thuộc vào việc lấy mẫu tính sẵn dữ liệu (DAS) để xác minh tính sẵn sàng của khối dữ liệu. Mẫu tính sẵn dữ liệu một chiều (1D DAS) cũng thân thiện với xây dựng Khối phân tán.
Có liên kết nào với nghiên cứu hiện tại không?
2.Bài viết theo dõi:
Về bài viết giải thích về DAS, mô hình:
Khả năng sử dụng 2D với cam kết KZG:
PeerDAS trên 5.ethresear.ch: Và bài báo:
6.EIP-7594:
Sự khác biệt tinh tế về khả năng khôi phục trong quá trình lấy mẫu 8.2D:
Còn cần làm gì nữa? Và còn có những sự cân nhắc nào khác?
Tiếp theo là hoàn thiện và triển khai PeerDAS. Sau đó, tăng số lượng blob trên PeerDAS một cách liên tục, đồng thời quan sát mạng và cải thiện phần mềm để đảm bảo an toàn, đây là một quá trình tiến triển. Đồng thời, chúng tôi hy vọng có nhiều công việc học thuật hơn để quy định PeerDAS và các phiên bản DAS khác cũng như tương tác với quy tắc lựa chọn fork và các vấn đề bảo mật khác.
Xa hơn nữa, chúng ta cần phải làm nhiều việc hơn để xác định phiên bản lý tưởng của DAS 2D và chứng minh các đặc tính an toàn của nó. Chúng tôi cũng hy vọng cuối cùng sẽ chuyển từ KZG sang một giải pháp thay thế an toàn lượng tử mà không yêu cầu thiết lập đáng tin cậy. Tại thời điểm này, vẫn chưa rõ ứng cử viên nào thân thiện với các bản dựng được phân phối. Ngay cả việc sử dụng các kỹ thuật “brute force” đắt tiền, tức là STARK đệ quy để tạo ra bằng chứng hợp lệ để tái tạo các hàng và cột, là không đủ, bởi vì trong khi về mặt kỹ thuật, STARK có kích thước của hàm băm O (log (n) * log (log (n)) (sử dụng STIR), STARK thực sự lớn gần bằng toàn bộ blob.
Con đường thực tế dài hạn mà tôi cho là:
Thực hiện 2D DAS lý tưởng;
Tiếp tục sử dụng 1D DAS, hy sinh hiệu suất băng thông mẫu để đơn giản hóa và tăng tính ổn định, và chấp nhận giới hạn dữ liệu thấp hơn.
(Hard pivot) Từ bỏ DA, hoàn toàn chấp nhận Plasma là kiến trúc Layer2 chính của chúng tôi theo dõi.
Vui lòng lưu ý rằng sự lựa chọn này vẫn tồn tại ngay cả khi chúng tôi quyết định mở rộng trực tiếp trên tầng L1. Điều này bởi vì nếu tầng L1 phải xử lý một lượng lớn TPS, khối L1 sẽ trở nên rất lớn và các máy khách sẽ muốn có một cách hiệu quả để xác minh tính chính xác của chúng. Do đó, chúng tôi sẽ phải sử dụng công nghệ tương tự với Rollup (như ZK-EVM và DAS) trên tầng L1.
Làm thế nào để tương tác với phần còn lại của bản đồ con đường?
Nếu thực hiện nén dữ liệu, nhu cầu của 2D DAS sẽ giảm đi, hoặc ít nhất là Trễ, nếu Plasma được sử dụng rộng rãi, nhu cầu sẽ giảm đi thêm. DAS cũng đặt ra thách thức về giao thức và cơ chế xây dựng Khối phân tán: mặc dù lý thuyết DAS thân thiện với việc tái xây dựng phân tán, nhưng điều này cần kết hợp với đề xuất danh sách inclusion và cơ chế chọn fork xung quanh nó trong thực tế.
Nén dữ liệu
Chúng tôi đang giải quyết vấn đề gì?
Mỗi giao dịch trong Rollup đều sẽ chiếm một lượng dữ liệu on-chain lớn: việc chuyển đổi ERC20 tốn khoảng 180 byte. Ngay cả khi có mẫu sẵn có lý tưởng, điều này cũng hạn chế tính mở rộng của giao thức Layer. Mỗi khe 16 MB, chúng ta có:
16000000 / 12 / 180 = 7407 TPS
Nếu chúng ta không chỉ có thể giải quyết vấn đề của tử số mà còn có thể giải quyết vấn đề của mẫu số, để mỗi giao dịch trong Rollup chiếm ít byte hơn trong chuỗi, điều đó sẽ như thế nào?
Nó là gì và hoạt động như thế nào?
The best explanation in my opinion is this picture from two years ago:
Trong việc nén byte không, chúng tôi sử dụng hai byte để thay thế mỗi chuỗi byte không dài, để biểu thị có bao nhiêu byte không. Hơn nữa, chúng tôi đã tận dụng các thuộc tính cụ thể của giao dịch:
Tích hợp chữ ký: Chúng tôi chuyển từ chữ ký ECDSA sang chữ ký BLS. Đặc tính của chữ ký BLS là nhiều chữ ký có thể kết hợp thành một chữ ký duy nhất, chứng minh được tính hiệu lực của tất cả chữ ký ban đầu. Ở tầng L1, do chi phí tính toán xác minh cao ngay cả khi tập hợp, nên không xem xét việc sử dụng chữ ký BLS. Tuy nhiên, trong môi trường ít dữ liệu như L2, việc sử dụng chữ ký BLS là có ý nghĩa. Đặc tính tập hợp của ERC-4337 cung cấp một con đường để thực hiện chức năng này.
Thay thế Địa chỉ bằng con trỏ: Nếu đã sử dụng một Địa chỉ trước đó, chúng ta có thể thay thế 20 byte Địa chỉ bằng con trỏ 4 byte trỏ đến vị trí trong lịch sử.
Tự tuần tự hóa giá trị giao dịch - Hầu hết các giá trị giao dịch có số chữ số rất ít, ví dụ, 0.25 ETH được biểu diễn như 250,000,000,000,000,000 wei. Phí giao dịch cơ bản tối đa và phí ưu tiên cũng tương tự. Do đó, chúng ta có thể sử dụng định dạng số thập phân tùy chỉnh để biểu diễn hầu hết các giá trị tiền tệ.
Có liên kết nào với nghiên cứu hiện tại không?
2.L2 Calldata tối ưu hợp đồng:
Dựa trên sự khác biệt về trạng thái phát hành của rollups bằng chứng hợp lệ (còn được gọi là ZK rollups) thay vì giao dịch:
BLS Ví tiền - Thực hiện BLS tổng hợp thông qua ERC-4337:
Cần làm gì tiếp theo và có những sự cân nhắc nào?
Tiếp theo, điều quan trọng là thực hiện thực tế các phương án đã nêu. Các yếu tố chính để cân nhắc bao gồm:
1、Chuyển sang chữ ký BLS đòi hỏi nỗ lực lớn và có thể Thả tương thích với chip cứng tin cậy có khả năng tăng cường tính an toàn. Có thể sử dụng gói ZK-SNARK ký thay thế.
3, việc công bố sự khác biệt trạng thái trên blockchain thay vì qua giao dịch sẽ giảm đi tính khả kiểm tra và làm cho nhiều phần mềm (ví dụ như khám phá blockchain) không thể hoạt động được.
Làm thế nào để tương tác với các phần khác của bản đồ con đường?
Việc áp dụng ERC-4337 và cuối cùng kết hợp các bộ phận của nó vào L2 EVM có thể đẩy nhanh đáng kể việc triển khai công nghệ tổng hợp. Đặt các phần của ERC-4337 trên L1 có thể tăng tốc độ triển khai của nó trên L2.
Plasma Chung
Chúng tôi đang giải quyết vấn đề gì?
Dù sử dụng blob và nén dữ liệu với kích thước 16 MB, 58.000 TPS cũng không đủ để đáp ứng hoàn toàn nhu cầu thanh toán của người tiêu dùng, giao tiếp xã hội phi tập trung hoặc các lĩnh vực có băng thông cao khác, đặc biệt là khi chúng ta bắt đầu xem xét yếu tố riêng tư, điều này có thể làm tăng khả năng mở rộng thêm 3-8 lần. Đối với các trường hợp ứng dụng có khối lượng lớn, giá trị thấp, một lựa chọn hiện tại là sử dụng Validium, nơi dữ liệu được lưu trữ off-chain và áp dụng một mô hình an ninh thú vị: các nhà điều hành không thể ăn cắp tiền của người dùng, nhưng họ có thể tạm thời hoặc vĩnh viễn đóng băng tài sản của tất cả người dùng. Nhưng chúng ta có thể làm tốt hơn.
Nó là gì, làm thế nào hoạt động?
Plasma là một giải pháp mở rộng, liên quan đến việc một nhà khai thác đưa Raft lên off-chain và đặt các gốc Merkle của các Raft này lên on-chain (khác với Rollup, Rollup sẽ đặt toàn bộ Raft lên on-chain). Đối với mỗi Raft, nhà khai thác sẽ gửi một nhánh Merkle cho mỗi người dùng để chứng minh sự thay đổi tài sản của người dùng đó hoặc không có sự thay đổi. Người dùng có thể rút tài sản của họ bằng cách cung cấp nhánh Merkle. Quan trọng là nhánh này không cần phải có gốc là trạng thái mới nhất. Do đó, ngay cả khi sẵn có sự cố về khả dụng dữ liệu, người dùng vẫn có thể khôi phục tài sản của họ bằng cách rút trạng thái mới nhất có sẵn của họ. Nếu người dùng gửi một nhánh không hợp lệ (ví dụ: rút tài sản họ đã gửi cho người khác hoặc nhà khai thác tự tạo ra một tài sản từ không), thì có thể xác định sự sở hữu hợp lệ của tài sản thông qua cơ chế thách thức on-chain.
Sơ đồ Plasma Cash Chain. Các giao dịch chi tiêu đồng tiền i được đưa vào vị trí thứ i của cây. Trong ví dụ này, giả sử tất cả các cây trước đó đều hợp lệ, chúng ta biết rằng Eve hiện đang sở hữu Token 1, David sở hữu Token 4, George sở hữu Token 6.
Phiên bản Plasma ban đầu chỉ xử lý các trường hợp thanh toán và không thể mở rộng hiệu quả hơn. Tuy nhiên, nếu chúng ta yêu cầu mỗi gốc đều được xác minh bằng SNARK, thì Plasma sẽ mạnh mẽ hơn nhiều. Mọi trò chơi thách thức đều có thể đơn giản hóa rất nhiều vì chúng ta loại bỏ hầu hết các con đường tiềm năng để các nhà điều hành gian lận. Đồng thời, cũng mở ra các con đường mới, giúp công nghệ Plasma có thể mở rộng sang các loại tài sản rộng lớn hơn. Cuối cùng, trong trường hợp nhà điều hành không gian lận, người dùng có thể rút tiền ngay lập tức mà không cần chờ đợi một tuần thời gian thách thức.
Một phương pháp (không phải là duy nhất) để tạo ra một chuỗi EVM Plasma: sử dụng ZK-SNARK để xây dựng một cây UTXO song song, cây này phản ánh sự thay đổi số dư được thực hiện bởi EVM và xác định ánh xạ duy nhất của ‘Token cùng loại’ tại các thời điểm khác nhau trong lịch sử. Sau đó, có thể xây dựng cấu trúc Plasma trên nó.
Một quan điểm then chốt là hệ thống Plasma không cần phải hoàn hảo. Ngay cả khi bạn chỉ có thể bảo vệ một phần của tài sản (ví dụ, chỉ là Token không di chuyển trong tuần qua), bạn cũng đã cải thiện đáng kể tình trạng hiện tại của EVM siêu mở rộng (cụ thể là Validium).
Loại cấu trúc khác là sự kết hợp Plasma/Rollup, ví dụ như Intmax. Các cấu trúc này đặt một lượng dữ liệu rất nhỏ của mỗi người dùng lên chuỗi (ví dụ, 5 byte), điều này giúp đạt được một số tính năng nằm giữa Plasma và Rollup: trong trường hợp của Intmax, bạn có thể đạt được sự mở rộng và quyền riêng tư rất cao, mặc dù trong lý thuyết, ngay cả trong dung lượng 16 MB, cũng chỉ giới hạn ở khoảng 16,000,000 / 12 / 5 = 266,667 TPS.
Có những liên kết liên quan nào với nghiên cứu hiện tại?
1.Original Plasma paper:
Plasma Cash:
Luồng tiền Plasma Cash:
4.Intmax (2023):
Vẫn cần làm gì nữa? Có những sự cân nhắc nào?
Nhiệm vụ chính còn lại là triển khai hệ thống Plasma vào ứng dụng thực tế. Như đã đề cập ở trên, Plasma và Validium không phải là một lựa chọn hoặc lựa chọn khác: bất kỳ Validium nào cũng có thể cải thiện tính bảo mật của nó ít nhất một mức độ bằng cách tích hợp các tính năng Plasma vào cơ chế rút tiền của nó. Nghiên cứu tập trung vào việc đạt được các thuộc tính tốt nhất cho EVM (từ yêu cầu tin cậy, chi phí Gas L1 tệ nhất và khả năng chống lại cuộc tấn công DoS), cũng như cấu trúc ứng dụng thay thế cụ thể. Hơn nữa, so với Rollup, Plasma có độ phức tạp về mặt khái niệm cao hơn, điều này đòi hỏi nghiên cứu và xây dựng một khung làm việc chung tốt hơn để giải quyết trực tiếp.
Việc cân nhắc chính với thiết kế Plasma là chúng phụ thuộc nhiều hơn vào các nhà điều hành và khó khăn hơn trong việc thiết lập, mặc dù thiết kế kết hợp Plasma/Rollup thường có thể tránh được điểm yếu này.
Làm thế nào để tương tác với phần còn lại của bản đồ con đường?
Khi giải pháp Plasma hiệu quả hơn, áp lực đối với tính sẵn có dữ liệu hiệu suất cao của L1 cũng nhỏ hơn. Việc di chuyển hoạt động sang L2 cũng có thể giảm áp lực MEV trên L1.
Hệ thống chứng minh L2 trưởng thành
Chúng tôi đang giải quyết vấn đề gì?
Hiện tại, hầu hết các Rollups chưa thực sự Không đáng tin cậy. Có một ủy ban an toàn có khả năng ghi đè (lạc quan hoặc hợp lệ) để chứng minh hành vi của hệ thống. Trong một số trường hợp, hệ thống chứng thực thậm chí không hoạt động, hoặc thậm chí nếu có, nó chỉ có chức năng “tư vấn”. Các bản tổng hợp hiện đại bao gồm: (i) một số bản tổng hợp dành riêng cho ứng dụng của Không đáng tin cậy, chẳng hạn như Nhiên liệu; (ii) Tại thời điểm viết bài, Optimism và Arbitrum là hai bản tổng hợp EVM đầy đủ đã đạt được các cột mốc không tin cậy một phần được gọi là “Giai đoạn 1”. Lý do Rollup không đạt được nhiều tiến bộ hơn là vì lo ngại về lỗi trong mã. Chúng tôi cần những bản tổng hợp không tin cậy, vì vậy chúng tôi phải đối mặt và giải quyết vấn đề này trực tiếp.
Nó là gì, làm thế nào hoạt động?
Đầu tiên, hãy xem lại hệ thống ‘stage’ được giới thiệu ban đầu trong bài viết này.
阶段 0:Người dùng phải có thể chạy Nút và đồng bộ chuỗi. Nếu xác minh là hoàn toàn đáng tin cậy / tập trung, cũng không sao.
Giai đoạn 1: Phải có một hệ thống chứng minh (không cần tin cậy) để đảm bảo chỉ có giao dịch hợp lệ mới được chấp nhận. Cho phép một ủy ban an ninh có thể lật đổ hệ thống chứng minh, nhưng phải có ngưỡng bỏ phiếu 75%. Ngoài ra, phần chặn quorum-blocking trong ủy ban (tức là 26%+) phải ở ngoài công ty chính xây dựng Rollup. Cho phép sử dụng cơ chế nâng cấp yếu hơn (ví dụ như DAO), nhưng nó phải có Trễ đủ lâu, nếu nó phê duyệt nâng cấp độc hại, người dùng có thể rút tiền của họ trước khi tiền của họ được kích hoạt.
Giai đoạn 2: Phải có một hệ thống chứng minh (không cần tin tưởng) để đảm bảo chỉ có giao dịch hợp lệ mới được chấp nhận. Ủy ban An ninh chỉ cho phép can thiệp khi có lỗi có thể chứng minh trong mã nguồn, ví dụ như nếu hai hệ thống chứng minh dư thừa không nhất quán với nhau, hoặc nếu một hệ thống chứng minh chấp nhận hai trạng thái post khác nhau của cùng một Khối (hoặc không chấp nhận bất kỳ nội dung nào trong một khoảng thời gian đủ lâu, ví dụ một tuần). Cho phép sử dụng cơ chế nâng cấp, nhưng phải có Trễ dài.
Mục tiêu của chúng tôi là đạt được giai đoạn 2. Thách thức chính của giai đoạn 2 là có đủ độ tin cậy để chứng minh hệ thống thực sự đáng tin cậy. Có hai phương pháp chính để thực hiện điều này:
Xác minh chính thức: Chúng ta có thể sử dụng toán học hiện đại và công nghệ tính toán để chứng minh (tích cực và hợp lệ) hệ thống chấp nhận chỉ các Khối tuân thủ theo quy định của EVM. Các công nghệ này đã tồn tại trong vài chục năm, nhưng sự tiến bộ gần đây (như Lean 4) đã làm cho chúng trở nên càng thực tế hơn, và sự tiến bộ trong việc chứng minh được hỗ trợ bởi trí tuệ nhân tạo có thể làm tăng tốc thêm cho xu hướng này.
Đa chứng minh (Multi-provers): Tạo nhiều hệ thống chứng minh và đầu tư tiền vào những hệ thống chứng minh này cùng với ủy ban an ninh (hoặc các công cụ nhỏ khác có giả định tin tưởng như TEE). Nếu các hệ thống chứng minh đồng ý, ủy ban an ninh sẽ không có quyền; nếu chúng không đồng ý, ủy ban an ninh chỉ có thể lựa chọn giữa các hệ thống này, và không thể đưa ra câu trả lời một mình.
Chương trình hình vẽ của người chứng minh nhiều, kết hợp một hệ thống chứng minh lạc quan, một hệ thống bằng chứng hợp lệ và một ủy ban an toàn.
Có liên kết nào với nghiên cứu hiện tại không?
Ngữ nghĩa EVM K (công việc xác minh hình thức từ năm 2017):
Bài diễn thuyết về ý tưởng chứng minh nhiều (2022):
Kế hoạch sử dụng chứng minh nhiều lớp:
Vẫn cần làm gì nữa? Có những sự cân nhắc nào?
Đối với Xác minh chính thức, khối lượng công việc rất lớn. Chúng ta cần tạo ra một phiên bản xác minh chính thức toàn bộ SNARK của EVM. Đây là một dự án cực kỳ phức tạp, mặc dù chúng ta đã bắt đầu tiến hành. Có một mẹo có thể giúp đơn giản hóa nhiều công việc này: chúng ta có thể tạo ra một bằng chứng xác minh chính thức cho một Máy ảo tối giản (ví dụ: RISC-V hoặc Cairo), sau đó triển khai EVM trong Máy ảo tối giản đó (và chứng minh hình thức rằng nó tương đương với các quy định khác của Máy ảo ETH).
Đối với multi-proof, còn hai phần chính chưa hoàn thành. Đầu tiên, chúng ta cần đủ tin cậy vào ít nhất hai hệ thống chứng minh khác nhau, đảm bảo rằng chúng đều an toàn đủ và đảm bảo rằng nếu chúng gặp vấn đề, thì các vấn đề này nên khác nhau và không liên quan (do đó chúng sẽ không đồng thời gặp vấn đề). Thứ hai, chúng ta cần tin tưởng rất cao vào logic cơ bản của hệ thống chứng minh hợp nhất. Mã này phải ít hơn nhiều. Có một số cách để làm cho nó rất nhỏ, chỉ cần lưu trữ tiền trong một hợp đồng multi-sign an toàn (Safe multisig) được đại diện bởi các hệ thống chứng minh, nhưng điều này sẽ tăng chi phí Gas on-chain. Chúng ta cần tìm một sự cân bằng giữa hiệu suất và an toàn.
Làm thế nào để tương tác với phần còn lại của bản đồ con đường?
Di chuyển hoạt động đến L2 có thể giảm áp lực MEV trên L1.
Cải tiến tương tác giữa L2 khác nhau
Chúng tôi đang giải quyết vấn đề gì?
Một trong những thách thức chính mà hệ sinh thái L2 đang đối mặt hiện nay là người dùng gặp khó khăn khi điều hướng trong đó. Ngoài ra, cách đơn giản nhất thường lại đưa ra giả định về sự tin cậy: chuỗi cross-interact, RPC client, v.v. Chúng ta cần để việc sử dụng hệ sinh thái L2 cảm giác như đang sử dụng một hệ sinh thái Ethereum thống nhất.
Nó là gì? Làm thế nào nó hoạt động?
Cải tiến tương tác L2 chéo có nhiều loại. Lý thuyết, ETH Rollup trung tâm làm việc với Phân mảnh L1 thực thi là một điều. Hệ sinh thái L2 hiện tại của ETH Blockchain vẫn còn những hạn chế so với trạng thái lý tưởng trong thực tế:
1、Địa chỉ của chuỗi cụ thể: Địa chỉ nên bao gồm thông tin chuỗi (L1, Optimism, Arbitrum…). Một khi điều này được thực hiện, quá trình gửi qua L2 có thể được thực hiện đơn giản bằng cách đặt Địa chỉ vào trường ‘Gửi’, lúc này Ví tiền có thể xử lý tự động cách gửi (bao gồm cả việc sử dụng giao thức tương tác chuỗi).
3, trao đổi và thanh toán gas chuỗi chéo: phải có một giao thức mở chuẩn hóa để diễn đạt các hoạt động trao đổi và thanh toán gas chuỗi chéo như “Tôi sẽ gửi 1 Ether cho người gửi 0,9999 Ether trên Arbitrum (trên Optimism)”, và “Tôi sẽ gửi 0,0001 Ether cho người chứa giao dịch này trên Arbitrum (trên Optimism)”. ERC-7683 là một sự cố gắng cho trường hợp đầu tiên, trong khi RIP-7755 là một sự cố gắng cho trường hợp thứ hai, mặc dù cả hai đều có phạm vi ứng dụng rộng hơn các trường hợp cụ thể này.
4、khách hàng ánh sáng:Người dùng cần có thể xác minh thực tế rằng họ đang tương tác với chuỗi mạng, chứ không chỉ tin tưởng vào nhà cung cấp RPC. Helios của a16z crypto có thể làm được điều này (đối với ETH chính), nhưng chúng ta cần mở rộng tính không tin cậy này lên L2. ERC-3668 (CCIP-read) là một chiến lược để đạt được mục tiêu này.
Làm thế nào để cập nhật xem nhật ký tiêu đề Ethereum của khách hàng ánh sáng. Sau khi có nhật ký tiêu đề, bạn có thể sử dụng Chứng chỉ Merkle để xác minh bất kỳ đối tượng trạng thái nào. Một khi bạn có đối tượng trạng thái L1 chính xác, bạn có thể sử dụng Chứng chỉ Merkle (nếu bạn muốn kiểm tra trước khi xác nhận, bạn cũng có thể sử dụng chữ ký) để xác minh bất kỳ đối tượng trạng thái nào trên L2. Helios đã thực hiện điều đó cho phần đầu. Mở rộng nó đến phần sau là một thử thách chuẩn hóa.
Một khái niệm cấp tiến hơn về “Shared Token Bridge”: Hãy tưởng tượng một thế giới nơi tất cả L2 là một Rollup bằng chứng hợp lệ và mỗi vị trí được gửi đến ETH Workshop. Ngay cả trong một thế giới như vậy, để chuyển tài sản từ L2 này sang L2 khác ở trạng thái bản địa, việc rút tiền và gửi tiền vẫn được yêu cầu, điều này đòi hỏi phải trả một khoản phí gas L1 đáng kể. Một cách để giải quyết vấn đề này là tạo ra một bản tổng hợp tối giản, được chia sẻ có chức năng duy nhất là duy trì L2 nào sở hữu từng loại mã thông báo và mỗi loại có bao nhiêu số dư và cho phép các số dư đó được cập nhật hàng loạt thông qua một loạt các hoạt động gửi chéo L2 do bất kỳ L2 nào khởi xướng. Điều này sẽ giúp bạn có thể chuyển qua L2 mà không phải trả phí gas L1 cho mỗi lần chuyển và không cần sử dụng các công nghệ dựa trên Thanh khoản như ERC-7683.
Tính toàn diện về tổ hợp: Cho phép việc gọi đồng bộ xảy ra giữa một L2 cụ thể và L1 hoặc giữa nhiều L2 khác nhau. Điều này giúp nâng cao hiệu suất tài chính của giao thức Tài chính phi tập trung. Trong trường hợp đầu tiên, việc này có thể được thực hiện mà không cần bất kỳ sự phối hợp chéo L2 nào; trong trường hợp thứ hai, cần có việc chia sẻ thứ tự. Công nghệ dựa trên Rollup tự động áp dụng cho tất cả các công nghệ này.
Có liên kết nào với nghiên cứu hiện tại không?
2.ERC-7683:
3.RIP-7755:
4.Scroll keystore Ví tiền设计式样:
Helios:
ERC-3668 (sometimes referred to as CCIP Read):
Đề xuất của Justin Drake về “dựa trên xác nhận trước (được chia sẻ)”:
8.L1SLOAD (RIP-7728):
REMOTESTATICCALL trong Optimism:
AggLayer, bao gồm cả ý tưởng về cầu mã thông tin chia sẻ:
Vẫn cần làm gì nữa? Có những sự cân nhắc nào?
Nhiều ví dụ trên phải đối mặt với một vấn đề nan giải về tiêu chuẩn khi nào nên tiêu chuẩn hóa và lớp nào cần tiêu chuẩn hóa. Nếu bạn chuẩn hóa quá sớm, bạn có thể cố thủ một giải pháp kém. Nếu bạn chuẩn hóa quá muộn, bạn có thể tạo ra sự phân mảnh không cần thiết. Trong một số trường hợp, có một giải pháp ngắn hạn với các thuộc tính yếu hơn dễ thực hiện hơn và một giải pháp dài hạn “cuối cùng đúng” nhưng mất nhiều năm để đạt được.
Những nhiệm vụ này không chỉ là vấn đề kỹ thuật mà chúng còn là vấn đề xã hội (thậm chí có thể là vấn đề chính), cần sự hợp tác của L2 và Ví tiền cũng như L1.
Làm thế nào để tương tác với phần còn lại của bản đồ con đường?
Hầu hết các đề xuất này là các cấu trúc “cấp cao hơn” và do đó có ít tác động đến các cân nhắc cấp L1. Một ngoại lệ là đặt hàng chia sẻ, có tác động đáng kể đến giá trị có thể trích xuất tối đa (MEV).
Mở rộng thực hiện trên L1
Chúng tôi đang giải quyết vấn đề gì?
Nếu L2 trở nên rất có thể mở rộng và thành công, nhưng L1 vẫn chỉ có thể xử lý một lượng khối lượng rất nhỏ, thì Ethereum có thể sẽ gặp nhiều rủi ro:
2, rất nhiều L2 được hưởng lợi từ việc liên kết chặt chẽ với hệ sinh thái tài chính phát triển mạnh trên L1. Nếu hệ sinh thái này bị suy yếu một cách đáng kể, thì sự động viên để trở thành L2 (thay vì trở thành L1 độc lập) sẽ giảm đi.
3, L2 cần mất thời gian rất lâu để đạt được mức đảm bảo an ninh hoàn toàn giống như L1.
4、Nếu L2 thất bại (ví dụ, do hành vi ác ý hoặc biến mất của nhà cung cấp dịch vụ), người dùng vẫn cần phải khôi phục tài sản của họ thông qua L1. Do đó, L1 cần đủ mạnh mẽ, ít nhất là có thể đôi khi xử lý công việc kết thúc phức tạp và hỗn loạn của L2.
Vì những lý do này, việc mở rộng L1 và đảm bảo rằng nó có thể tiếp tục chứa đựng nhiều hơn và nhiều hơn các trường hợp sử dụng là rất có giá trị.
Nó là gì? Làm thế nào nó hoạt động?
Cách mở rộng đơn giản nhất là tăng giới hạn gas trực tiếp. Tuy nhiên, điều này có thể làm cho L1 trở nên tập trung, từ đó làm suy yếu một tính năng quan trọng khác của ETH: tính đáng tin cậy của lớp cơ sở mạnh mẽ. Mức độ tăng giới hạn gas một cách đơn giản đến đâu là bền vững vẫn còn tranh cãi, và điều này cũng sẽ khác nhau tùy thuộc vào việc triển khai những công nghệ khác nhau để làm cho việc xác minh khối lớn dễ dàng hơn (ví dụ, lịch sử hết hạn, không trạng thái, bằng chứng hợp lệ L1 EVM). Một điều quan trọng khác cần liên tục cải thiện là hiệu suất của phần mềm máy khách ETH, hiệu suất hiện tại cao hơn nhiều so với năm năm trước. Chiến lược tăng giới hạn gas L1 hiệu quả sẽ bao gồm việc tăng tốc sự phát triển của các công nghệ xác minh này.
1.EOF:một định dạng bytecode EVM mới, thân thiện với phân tích tĩnh hơn, có thể thực hiện nhanh hơn. Với những cải tiến hiệu suất này, bytecode EOF có thể thu được phí gas thấp hơn.
Giá gas đa chiều: Đặt các chi phí cơ bản và giới hạn khác nhau cho tính toán, dữ liệu và lưu trữ, có thể tăng khả năng chứa trung bình của ETH L1 mà không tăng tải trọng tối đa (để tránh tạo ra rủi ro bảo mật mới).
Thả các mã hoạt động cụ thể và chi phí Gas đã được biên soạn - Lịch sử cho thấy, để tránh tấn công từ chối dịch vụ, chúng tôi đã tăng chi phí Gas cho một số hoạt động được định giá quá thấp nhiều lần. Một điều có thể làm thêm nữa là, Thả chi phí Gas của các mã hoạt động được định giá quá cao. Ví dụ, phép cộng rẻ hơn phép nhân rất nhiều, nhưng hiện tại chi phí của các mã hoạt động ADD và MUL lại giống nhau. Chúng ta có thể Thả chi phí của ADD, thậm chí là giảm chi phí của các hoạt động đơn giản như PUSH. EOF nhìn chung có thể được tối ưu hóa hơn trong lĩnh vực này.
4.EVM-MAX và SIMD: EVM-MAX là một đề xuất cho phép tính toán số lớn nguyên tự nhiên hiệu quả hơn như một mô-đun độc lập của EVM. Trừ khi có ý định xuất, giá trị tính toán của EVM-MAX chỉ có thể được truy cập bởi các mã hoạt động EVM-MAX khác. Điều này cho phép có không gian lớn hơn để tối ưu hóa việc lưu trữ các giá trị này. SIMD (single instruction multiple data) là một đề xuất cho phép thực hiện hiệu quả cùng một chỉ thị đối với mảng giá trị. Cả hai cùng có thể tạo ra một bộ xử lý phụ mạnh mẽ bên cạnh EVM, có thể được sử dụng để thực hiện mã hóa hiệu quả hơn. Điều này đặc biệt hữu ích đối với các giao thức bảo mật và hệ thống bảo vệ L2, do đó nó sẽ giúp mở rộng L1 và L2.
Những cải tiến này sẽ được thảo luận kỹ hơn trong các bài viết Splurge sau này.
Cuối cùng, chiến lược thứ ba là Rollups nguyên bản (hoặc rollups được công nhận): Về cơ bản, tạo ra nhiều bản sao EVM chạy song song để tạo ra một mô hình tương đương với những gì Rollup có thể cung cấp, nhưng tích hợp nhiều hơn vào giao thức giao thức.
Có liên kết nào với nghiên cứu hiện tại không?
Lộ trình mở rộng ETH Polynya của Polynya L1:
Định giá Gas đa chiều:
3.EIP-7706:
4.EOF:
5.EVM-MAX:
6.SIMD:
Rollups nguyên bản:
Phỏng vấn Max Resnick về giá trị mở rộng L1:
9.Justin Drake 谈使用 SNARK 和原生 Rollups 进行扩展:
Cần làm gì tiếp theo và có những sự cân nhắc nào?
Mở rộng L1 có ba chiến lược, có thể thực hiện độc lập hoặc song song:
Cải thiện công nghệ (ví dụ: mã nguồn máy khách, máy khách không trạng thái, quá hạn lịch sử) để L1 dễ xác minh hơn, sau đó tăng giới hạn gas.
Thả chi phí hoạt động cụ thể, tăng dung lượng trung bình mà không tăng nguy cơ tình huống tồi nhất;
Rollups nguyên thủy (tức là tạo N bản sao song song của EVM).
Hiểu về những công nghệ khác nhau này, chúng ta sẽ thấy mỗi cái đều có những sự lựa chọn khác nhau. Ví dụ, Rollups gốc có nhiều điểm yếu tương tự như các Rollups thông thường về khả năng kết hợp: bạn không thể gửi một giao dịch duy nhất để thực hiện các hoạt động đồng bộ qua nhiều Rollup giống như bạn có thể làm trong một hợp đồng trên cùng một L1 (hoặc L2). Tăng giới hạn Gas sẽ làm suy yếu những lợi ích khác có thể đạt được thông qua việc xác minh đơn giản hóa trên L1, chẳng hạn như tăng tỷ lệ người dùng xác minh Nút và số lượng người gửi đặt cược solo. Tùy thuộc vào cách triển khai, làm cho các hoạt động cụ thể trong EVM (Máy ảo Ethereum) rẻ hơn có thể làm tăng tính phức tạp của EVM toàn cầu.
Một câu hỏi quan trọng mà bất kỳ lộ trình mở rộng L1 nào cũng cần trả lời là: Tầm nhìn cuối cùng của L1 và L2 lần lượt là gì? Rõ ràng, việc đặt tất cả nội dung trên L1 là điều vô lý: các kịch bản ứng dụng tiềm năng có thể liên quan đến hàng trăm nghìn giao dịch mỗi giây, điều này sẽ làm cho L1 không thể xác minh (trừ khi chúng ta áp dụng phương pháp Rollup nguyên bản). Tuy nhiên, chúng ta thực sự cần một số nguyên tắc hướng dẫn để đảm bảo rằng chúng ta sẽ không rơi vào tình thế như vậy: Giới hạn gas tăng 10 lần, gây tổn hại nghiêm trọng cho sự phi tập trung của Ethereum L1.
Làm thế nào để tương tác với phần còn lại của bản đồ con đường?
Đưa thêm người dùng vào L1 không chỉ đồng nghĩa với việc nâng cấp khả năng mở rộng, mà còn đồng nghĩa với việc cải thiện các khía cạnh khác của L1. Điều này có nghĩa là nhiều hơn MEV sẽ được giữ lại trên L1 (thay vì chỉ là vấn đề của L2), do đó, nhu cầu xử lý MEV một cách rõ ràng sẽ trở nên cấp bách hơn. Điều này sẽ tăng đáng kể giá trị thời gian khe nhanh trên L1. Đồng thời, điều này cũng phụ thuộc rất nhiều vào việc xác nhận L1 (the Verge) tiến hành một cách thuận lợi.
Đọc thêm: “Vitalik bài viết mới: Ethereum PoS có những cải tiến nào khác? Làm thế nào để thực hiện?”
Liên kết gốc