Đặc biệt cảm ơn Justin Drake, Francesco, Hsiao-wei Wang, @antonttc và Georgios Konstantopoulos.
Ban đầu, trong bản đồ đường của Ethereum có hai chiến lược mở rộng. Một chiến lược (xem bản báo cáo sớm năm 2015) là “Phân mảnh” (sharding): Mỗi Nút chỉ cần xác minh và lưu trữ một phần nhỏ giao dịch, thay vì xác minh và lưu trữ tất cả giao dịch trên chuỗi. Bất kỳ mạng ngang hàng nào khác (ví dụ BitTorrent) cũng hoạt động theo cách này, vì vậy chúng ta dĩ nhiên có thể làm cho blockchain hoạt động theo cách tương tự. Một chiến lược khác là giao thức Layer 2: Các mạng này sẽ nằm phía trên Ethereum, cho phép nó tận dụng đầy đủ tính bảo mật, đồng thời giữ một phần lớn dữ liệu và tính toán ngoài Chuỗi chính. Giao thức Layer 2 đề cập đến state channels năm 2015, Plasma năm 2017, và sau đó là Rollup năm 2019. Rollup mạnh mẽ hơn state channels hoặc Plasma, nhưng chúng cần băng thông dữ liệu on-chain lớn. May mắn thay, đến năm 2019, nghiên cứu Phân mảnh đã giải quyết vấn đề “tính khả dụng” của việc xác minh quy mô lớn. Kết quả là, hai con đường hòa nhập và chúng ta có được bản đồ đường với Rollup ở trung tâm, bản đồ đường mà ngày nay vẫn là chiến lược mở rộng của Ethereum.
The Surge, bản đồ con đường 2023
Lộ trình tập trung vào Rollup đề xuất một phân công đơn giản: ETH là tầng L1 tập trung vào việc trở thành một lớp cơ sở mạnh mẽ và phi tập trung, trong khi L2 đảm nhận nhiệm vụ giúp hệ sinh thái mở rộng. Mô hình này tồn tại ở khắp mọi nơi trong xã hội: sự tồn tại của hệ thống tòa án (L1) không phải là để đạt được tốc độ siêu cao và hiệu quả cao, mà là để bảo vệ hợp đồng và quyền sở hữu, trong khi các nhà khởi nghiệp (L2) phải xây dựng trên một nền tảng cơ bản vững chắc này, dẫn dắt loài người tiến đến sao Hỏa (cả về nghĩa đen và ẩn dụ).
Trong năm nay, bản đồ tập trung vào Rollup đã đạt được những thành tựu quan trọng: với việc triển khai các blobs EIP-4844, băng thông dữ liệu của ETH L1 đã tăng đáng kể, và nhiều sự đa dạng hóa của Máy ảo Ethereum (EVM) Rollup đã bước vào giai đoạn đầu tiên. Mỗi L2 tồn tại như một ‘Phân mảnh’ với các quy tắc và logic nội bộ riêng, và việc đa dạng hóa cách thức triển khai Phân mảnh hiện đã trở thành hiện thực. Tuy nhiên, như chúng ta đã thấy, việc đi đường này cũng đối mặt với một số thách thức đặc biệt. Do đó, nhiệm vụ hiện tại của chúng ta là hoàn thiện bản đồ tập trung vào Rollup và giải quyết những vấn đề này, đồng thời duy trì tính ổn định và tính Phi tập trung đặc biệt của ETH L1.
The Surge: Mục Tiêu Chính
Trong tương lai, Ethereum có thể đạt hơn 100.000 TPS thông qua L2;
Giữ tính phi tập trung và tính ổn định của L1;
3、Ít nhất một số L2 hoàn toàn thừa hưởng các thuộc tính cốt lõi của Ethereum (Không đáng tin cậy, mở, chống kiểm duyệt);
Ethereum nên giống như một hệ sinh thái thống nhất thay vì 34 blockchain khác nhau.
Nội dung chương này
Bất đồng mở rộng tam giác
Tiến bộ tiếp theo trong việc lấy mẫu khả dụng dữ liệu
Nén dữ liệu
Plasma Tổng Quát
Hệ thống chứng minh L2 đã trưởng thành
Cải thiện tích hợp qua L2
Mở rộng thực hiện trên L1
Nghịch lý tam giác mở rộng
Nút mạng có chi phí thấp hơn (cụ thể hơn là: chi phí hoạt động của Nút thấp), số lượng giao dịch xử lý nhiều và An toàn (kẻ tấn công cần phá hủy một phần lớn của Nút mạng để giao dịch thất bại).
Điều đáng chú ý là, Paradox tam giác không phải là một định lý, và bài viết giới thiệu về Paradox tam giác cũng không đi kèm với bất kỳ chứng minh toán học nào. Nó thực sự đưa ra một luận điểm toán học theo cảm hứng: nếu một Nút thân thiện với Phi tập trung (ví dụ: máy tính xách tay tiêu dùng) có thể xác minh N giao dịch mỗi giây, và bạn có một chuỗi xử lý k*N giao dịch mỗi giây, thì (i) mỗi giao dịch chỉ có thể được nhìn thấy bởi 1/k Nút, điều này có nghĩa là kẻ tấn công chỉ cần phá hủy một số ít Nút là có thể thông qua một giao dịch độc hại, hoặc (ii) Nút của bạn sẽ trở nên mạnh mẽ, trong khi chuỗi của bạn không sẽ trở nên Phi tập trung. Mục đích của bài viết này không phải là chứng minh việc phá vỡ Paradox tam giác là không thể; ngược lại, mục tiêu của nó là cho thấy việc phá vỡ Paradox tam giác là khó khăn, nó đòi hỏi phải thoát khỏi khung tư duy ngầm định của luận điệu đó một cách nào đó.
Trong nhiều năm qua, một số chuỗi hiệu suất cao thường tuyên bố rằng họ đã giải quyết được ba mâu thuẫn trong khi không thay đổi cơ sở kiến trúc, thường thông qua việc tối ưu hóa Nút bằng các kỹ thuật kỹ thuật phần mềm. Điều này luôn luôn gây hiểu lầm, vì việc vận hành Nút on-chain này khó khăn hơn nhiều so với việc vận hành Nút trên ETH. Bài viết này sẽ thảo luận về lý do tại sao lại như vậy, cũng như tại sao chỉ bằng kỹ thuật kỹ thuật phần mềm L1 không thể mở rộng ETH?
Tuy nhiên, việc kết hợp lấy mẫu sẵn có dữ liệu với SNARKs thực sự giải quyết được nghịch lý tam giác: nó cho phép máy khách xác minh rằng một số lượng nhất định dữ liệu có sẵn và một số lượng nhất định bước tính toán được thực hiện đúng trong trường hợp chỉ cần tải xuống một lượng nhỏ dữ liệu và thực hiện một lượng rất ít tính toán. SNARKs là không cần tin cậy. Lấy mẫu sẵn có dữ liệu có mô hình tin cậy few-of-N tinh tế, nhưng nó vẫn giữ các đặc tính cơ bản của chuỗi không mở rộng, nghĩa là ngay cả khi tấn công 51% cũng không thể buộc các khối xấu được mạng chấp nhận.
Một phương pháp khác để giải quyết tình trạng khó khăn ba là kiến trúc Plasma, nó sử dụng công nghệ tinh vi để chuyển trách nhiệm theo dõi sự khả dụng dữ liệu cho người dùng một cách khích lệ mà tương thích. Vào thời kỳ 2017-2019, khi chúng ta chỉ có cách để mở rộng khả năng tính toán là bằng chứng gian lận, kiến trúc Plasma bị hạn chế rất nhiều về mặt an toàn, nhưng với sự phổ biến của SNARKs (chứng minh không chứng minh tương tác không chi tiết), kiến trúc Plasma trở nên khả thi hơn đối với nhiều trường hợp sử dụng hơn so với trước đây.
Sự tiến triển tiếp theo của việc lấy mẫu sẵn có dữ liệu
Chúng tôi đang giải quyết vấn đề gì?
Ngày 13 tháng 3 năm 2024, khi Dencun nâng cấp và ra mắt, mỗi slot trên blockchain của ETH sẽ có khoảng 3 blob có kích thước khoảng 125 kB trong 12 giây, hoặc băng thông dữ liệu khoảng 375 kB cho mỗi slot. Giả sử dữ liệu giao dịch được công bố trực tiếp trên on-chain, việc chuyển tiền ERC 20 sẽ chiếm khoảng 180 byte, do đó TPS tối đa trên Rollup của ETH là: 375000 / 12 / 180 = 173.6 TPS
Nếu chúng ta thêm calldata của Ethereum (giá trị lý thuyết tối đa: mỗi khe 30 triệu Gas / mỗi byte 16 gas = mỗi khe 1.875.000 byte), thì tốc độ sẽ tăng lên 607 TPS. Sử dụng PeerDAS, số lượng blob có thể tăng lên 8-16, điều này sẽ cung cấp 463-926 TPS cho calldata.
Đây là một cải tiến quan trọng đối với ETH L1, nhưng vẫn chưa đủ. Chúng tôi muốn có thêm tính mở rộng. Mục tiêu trung hạn của chúng tôi là mỗi slot 16 MB, nếu kết hợp với cải tiến nén dữ liệu Rollup, sẽ mang lại khoảng 58000 TPS.
Nó là gì? Làm thế nào để chạy?
PeerDAS là một triển khai tương đối đơn giản của “lấy mẫu 1 D”. Trong ETH, mỗi blob là một đa thức bậc 4096 trên trường nguyên tố 253 bit. Chúng tôi phát các cổ phiếu của đa thức, trong đó mỗi phần chứa 16 giá trị được đánh giá từ 16 tọa độ liền kề trong tổng số 8192 tọa độ. Trong số 8192 giá trị đánh giá này, bất kỳ 4096 nào (theo các thông số được đề xuất hiện tại: 64 trong số 128 mẫu có thể) đều có thể phục hồi các đốm màu.
Nguyên lý hoạt động của PeerDAS là cho mỗi client lắng nghe một số mạng con, trong đó mạng con thứ i phát sóng bất kỳ blob thứ i nào và yêu cầu các blob khác trên các mạng con khác thông qua việc hỏi các đối tác trên mạng toàn cầu p2p (người sẽ nghe các mạng con khác nhau). Phiên bản thận trọng hơn SubnetDAS chỉ sử dụng cơ chế mạng con mà không có lớp hỏi đối tác bổ sung. Đề xuất hiện tại là để các Nút tham gia Bằng chứng về cổ phần sử dụng SubnetDAS, trong khi các Nút khác (tức là client) sử dụng PeerDAS.
Về mặt lý thuyết, chúng ta có thể mở rộng quy mô “lấy mẫu 1 D” lên khá lớn: nếu chúng ta tăng số lượng blob tối đa lên 256 (với mục tiêu là 128), thì chúng ta có thể đạt được mục tiêu 16 MB và 16 mẫu trên mỗi Nút trong lấy mẫu dữ liệu sẵn có * 128 blob trên mỗi blob 512 byte mỗi mẫu = 1 MB băng thông dữ liệu trên mỗi khe. Điều này hầu như không nằm trong khả năng chịu đựng của chúng tôi: nó có thể thực hiện được, nhưng điều đó có nghĩa là các máy khách bị hạn chế về băng thông không thể lấy mẫu. Chúng ta có thể tối ưu hóa điều này ở một mức độ nào đó bằng cách giảm số lượng blob và tăng kích thước blob, nhưng điều này làm cho việc xây dựng lại tốn kém hơn.
Vì vậy, chúng tôi muốn tiến xa hơn và thực hiện mẫu 2D (2D sampling), phương pháp này không chỉ thực hiện lấy mẫu ngẫu nhiên trong blob mà còn giữa các blob. Sử dụng tính chất tuyến tính của cam kết KZG, mở rộng tập hợp blob trong một khối thông qua một nhóm blob ảo mới, các blob ảo này mã hóa thông tin trùng lặp.
Vì vậy, cuối cùng chúng tôi muốn đi một bước xa hơn và thực hiện mẫu 2D, không chỉ trong blob mà còn giữa các blob ngẫu nhiên. Thuộc tính tuyến tính của KZG được sử dụng để mở rộng tập hợp các blob trong một Khối, bao gồm danh sách blob ảo mới mã hóa dự phòng cho cùng thông tin.
2D lấy mẫu. Nguồn dữ liệu: a16z crypto
Quan trọng nhất là, việc mở rộng cam kết tính toán không cần có blob, do đó, phương án này thân thiện với xây dựng Khối phân tán. Các nút thực tế xây dựng Khối chỉ cần có cam kết KZG blob và họ có thể dựa vào việc lấy mẫu tính sẵn sẵn có (DAS) để xác minh tính khả dụng của khối dữ liệu. Việc lấy mẫu tính sẵn khả dụng dữ liệu một chiều (1D DAS) cũng thân thiện với xây dựng khối phân tán.
Có liên kết nào với nghiên cứu hiện có không?
Bài viết gốc giới thiệu về tính khả dụng của dữ liệu (2018):
Bài viết tiếp theo:
Về bài viết giải thích về DAS, mô hình:
2D có sẵn với cam kết KZG:
PeerDAS on ethresear.ch: And the paper:
EIP-7594:
SubnetDAS trên ethresear.ch:
Sự khác biệt tinh tế có thể khôi phục trong mẫu 2D:
Cần làm gì tiếp theo? Còn những sự cân nhắc nào khác?
Tiếp theo là hoàn thiện và triển khai PeerDAS. Sau đó, tiếp tục tăng số lượng blob trên PeerDAS và cùng lúc quan sát mạng và cải thiện phần mềm để đảm bảo an toàn, đây là quá trình dần dần. Đồng thời, chúng tôi hy vọng có nhiều công việc học thuật hơn để điều chỉnh PeerDAS và các phiên bản DAS khác cũng như tương tác với quy tắc lựa chọn fork và các vấn đề an ninh khác.
Xa hơn nữa, chúng ta cần phải làm nhiều việc hơn để xác định phiên bản lý tưởng của DAS 2D và chứng minh các đặc tính an toàn của nó. Chúng tôi cũng hy vọng cuối cùng sẽ chuyển từ KZG sang một giải pháp thay thế an toàn lượng tử mà không yêu cầu thiết lập đáng tin cậy. Tại thời điểm này, vẫn chưa rõ ứng cử viên nào thân thiện với các bản dựng được phân phối. Ngay cả việc sử dụng các kỹ thuật “brute force” đắt tiền, tức là STARK đệ quy để tạo ra bằng chứng hợp lệ để tái tạo các hàng và cột, là không đủ, bởi vì trong khi về mặt kỹ thuật, STARK có kích thước của hàm băm O (log (n) * log (log (n)) (sử dụng STIR), STARK thực sự lớn gần bằng toàn bộ blob.
Con đường thực tế dài hạn mà tôi coi là:
Triển khai DAS 2D lý tưởng;
Tiếp tục sử dụng 1 D DAS, hy sinh hiệu suất băng thông mẫu, chấp nhận giới hạn dữ liệu thấp hơn để đơn giản hóa và tăng tính ổn định
Vui lòng lưu ý rằng, ngay cả khi chúng tôi quyết định mở rộng trực tiếp trên tầng L1, sự lựa chọn này vẫn tồn tại. Điều này bởi vì nếu tầng L1 phải xử lý một lượng lớn TPS, Khối L1 sẽ trở nên rất lớn, người dùng sẽ muốn có một cách hiệu quả để xác minh tính chính xác của chúng, do đó chúng tôi sẽ phải sử dụng công nghệ giống như Rollup (như ZK-EVM và DAS) tại tầng L1.
Làm thế nào để tương tác với các phần khác của lộ trình?
Nếu triển khai nén dữ liệu, nhu cầu của 2D DAS sẽ giảm đi hoặc ít nhất sẽ bị trễ, nếu Plasma được sử dụng rộng rãi, nhu cầu sẽ giảm thêm. DAS cũng đặt ra thách thức đối với fork và cơ chế xây dựng giao thức phân tán: mặc dù về lý thuyết, DAS thân thiện với việc xây dựng phân tán, nhưng điều này cần phối hợp với đề xuất danh sách inclusion package và cơ chế lựa chọn fork xung quanh nó khi thực hiện.
Nén dữ liệu
Chúng tôi đang giải quyết vấn đề gì?
Mỗi giao dịch trong Rollup đều chiếm một lượng không gian dữ liệu on-chain lớn: Việc chuyển đổi ERC 20 tốn khoảng 180 byte. Ngay cả khi có mẫu sẵn có lý tưởng, điều này cũng giới hạn tính mở rộng của giao thức Layer. Mỗi khe 16 MB, chúng ta có được:
16000000 / 12 / 180 = 7407 TPS
Nếu chúng ta không chỉ có thể giải quyết vấn đề của tử số mà còn có thể giải quyết vấn đề của mẫu số, làm cho giao dịch trong mỗi Rollup chiếm ít byte hơn trên chuỗi, thì sẽ thế nào?
Nó là gì, làm thế nào hoạt động?
Theo tôi, phản ánh tốt nhất là bức ảnh từ hai năm trước:
Trong quá trình nén byte không, chúng tôi thay thế mỗi chuỗi byte không dài bằng hai byte để biểu thị có bao nhiêu byte không. Hơn nữa, chúng tôi sử dụng các thuộc tính cụ thể của giao dịch:
Ký tục hợp: Chúng tôi đã chuyển từ chữ ký ECDSA sang chữ ký BLS, đặc điểm của chữ ký BLS là nhiều chữ ký có thể được kết hợp thành một chữ ký duy nhất, chữ ký này có thể chứng minh tính hiệu lực của tất cả các chữ ký gốc. Ở lớp L1, vì tính toán chi phí xác minh là cao ngay cả khi kết hợp, nên không xem xét việc sử dụng chữ ký BLS. Nhưng trong môi trường ít dữ liệu như L2, việc sử dụng chữ ký BLS là có ý nghĩa. Đặc điểm kết hợp của ERC-4337 cung cấp một cách để thực hiện chức năng này.
Sử dụng con trỏ thay thế 01928374656574839201: Nếu trước đây bạn đã sử dụng một 01928374656574839201, chúng ta có thể thay thế 20 byte của 01928374656574839201 bằng con trỏ 4 byte trỏ đến vị trí trong lịch sử.
Độ trượt tùy chỉnh của giá trị giao dịch - Hầu hết các giá trị giao dịch có số chữ số rất ít, ví dụ, 0,25 ETH được biểu thị bằng 250.000.000.000.000.000 wei. Phí giao dịch cơ bản tối đa và phí ưu tiên cũng tương tự. Do đó, chúng ta có thể sử dụng định dạng số thập phân tùy chỉnh để biểu diễn hầu hết các giá trị tiền tệ.
Có liên kết nào với nghiên cứu hiện có không?
Khám phá sequence.xyz:
Tối ưu hóa hợp đồng Calldata L2:
Dựa trên bằng chứng hợp lệ của Rollups (còn được gọi là ZK rollups) để phân biệt trạng thái triển khai chứ không phải giao dịch:
BLS Ví tiền - Triển khai BLS tập hợp thông qua ERC-4337:
Còn cần làm gì, có những sự cân nhắc nào?
Điều tiếp theo cần làm là thực sự thực hiện kịch bản trên. Sự đánh đổi chính bao gồm:
Chuyển sang chữ ký BLS đòi hỏi nỗ lực lớn và sự tương thích với chip phần cứng đáng tin cậy để tăng cường tính bảo mật. Nó có thể được thay thế bằng gói ZK-SNARK hỗ trợ các phương pháp ký khác.
Nén động (ví dụ, thay thế bằng con trỏ) sẽ làm cho mã nguồn khách hàng trở nên phức tạp.
3、đưa sự khác biệt về trạng thái lên on-chain thay vì giao dịch, sẽ Thả tính khả kiểm tra và khiến nhiều phần mềm (ví dụ như khám phá blockchain) không thể hoạt động.
Làm thế nào để tương tác với các phần khác của bản đồ đường đi?
Sử dụng ERC-4337 và cuối cùng sẽ đưa một phần nội dung của nó vào L2 EVM, có thể làm tăng tốc độ triển khai công nghệ tổng hợp một cách đáng kể. Việc đặt một phần nội dung của ERC-4337 trên L1 có thể làm tăng tốc độ triển khai của nó trên L2.
Plasma Tổng Quát
Chúng tôi đang giải quyết vấn đề gì?
Ngay cả khi sử dụng 16 MB của blob và nén dữ liệu, 58,000 TPS cũng không đủ để đáp ứng hoàn toàn nhu cầu thanh toán của người tiêu dùng, mạng xã hội Phi tập trung hay các lĩnh vực có băng thông cao khác, đặc biệt là khi chúng ta bắt đầu xem xét yếu tố riêng tư, điều này có thể làm tăng khả năng mở rộng lên 3-8 lần. Đối với các tình huống ứng dụng có khối lượng giao dịch cao và giá trị thấp, lựa chọn hiện tại là sử dụng Validium, nơi dữ liệu được lưu trữ off-chain và áp dụng một mô hình an toàn thú vị: nhà điều hành không thể lấy cắp tiền của người dùng, nhưng họ có thể tạm thời hoặc vĩnh viễn đóng băng tài khoản của tất cả người dùng. Nhưng chúng ta có thể làm tốt hơn.
Nó là gì và hoạt động như thế nào?
Plasma là một giải pháp mở rộng, nó liên quan đến việc một nhà khai thác đưa Khối ra khỏi chuỗi và đặt các Merkle root của những Khối này lên chuỗi (khác với Rollup, Rollup sẽ đặt toàn bộ Khối lên chuỗi). Đối với mỗi Khối, nhà khai thác sẽ gửi cho mỗi người dùng một nhánh Merkle để chứng minh tài sản của người dùng đã thay đổi như thế nào, hoặc không thay đổi. Người dùng có thể rút tài sản của họ bằng cách cung cấp nhánh Merkle. Quan trọng là, nhánh này không nhất thiết phải có Merkle root mới nhất. Do đó, ngay cả khi sự sẵn có của dữ liệu gặp vấn đề, người dùng vẫn có thể khôi phục tài sản của họ bằng cách rút tài sản có sẵn mới nhất của họ. Nếu người dùng gửi một nhánh không hợp lệ (ví dụ, rút tài sản họ đã gửi cho người khác, hoặc nhà khai thác tự tạo ra một tài sản từ không), thì có thể thông qua cơ chế thách thức trên chuỗi để xác định quyền sở hữu hợp lệ của tài sản.
Sơ đồ Plasma Cash Chain. Giao dịch sử dụng đồng tiền i được đặt ở vị trí thứ i trên cây. Trong ví dụ này, giả sử tất cả các cây trước đó đều hợp lệ, chúng ta biết rằng Eve hiện đang sở hữu Token 1, David sở hữu Token 4, George sở hữu Token 6.
Phiên bản Plasma ban đầu chỉ có thể xử lý các trường hợp thanh toán và không thể mở rộng hiệu quả hơn. Tuy nhiên, nếu chúng ta yêu cầu mỗi gốc được xác minh bằng SNARK, thì Plasma sẽ mạnh mẽ hơn nhiều. Mỗi trò chơi thách thức có thể được đơn giản hóa đáng kể vì chúng ta loại bỏ hầu hết các con đường có thể gian lận của nhà khai thác. Đồng thời, cũng mở ra những con đường mới, cho phép Plasma mở rộng sang các loại tài sản rộng hơn. Cuối cùng, trong trường hợp nhà khai thác không gian lừa đảo, người dùng có thể rút tiền ngay lập tức mà không cần chờ đợi thời gian thách thức một tuần.
Một phương pháp để tạo ra một chuỗi EVM Plasma (không phải là phương pháp duy nhất): sử dụng ZK-SNARK để xây dựng một cây UTXO song song, cây này phản ánh sự thay đổi cân bằng được thực hiện bởi EVM và xác định ánh xạ duy nhất của ‘Token’ cùng một tại các thời điểm khác nhau trong lịch sử. Sau đó, có thể xây dựng cấu trúc Plasma trên nó.
Một cái nhìn quan trọng là hệ thống Plasma không cần phải hoàn hảo. Ngay cả khi bạn chỉ có thể bảo vệ một phần nhỏ tài sản (ví dụ như Token không di chuyển trong tuần qua), bạn cũng đã cải thiện đáng kể tình trạng hiện tại của EVM siêu mở rộng (gọi là Validium).
Một loại cấu trúc khác là Plasma/Rollup kết hợp, ví dụ như Intmax. Cấu trúc này đặt một lượng dữ liệu rất nhỏ của mỗi người dùng lên chuỗi (ví dụ, 5 byte) để đạt được một số tính năng nằm giữa Plasma và Rollup: trong trường hợp của Intmax, bạn có thể đạt được tính mở rộng và tính riêng tư rất cao, mặc dù lý thuyết chỉ giới hạn trong khoảng 16,000,000 / 12 / 5 = 266,667 TPS ngay cả trong dung lượng 16 MB.
Có những liên kết liên quan đến nghiên cứu hiện có nào?
Bản gốc của giấy Plasma:
Plasma Cash:
Plasma Cashflow:
Intmax ( 2023):
Còn gì cần phải làm? Có những sự cân nhắc nào?
Nhiệm vụ chính còn lại là triển khai hệ thống Plasma vào ứng dụng thực tế. Như đã nói ở trên, Plasma không phải là sự lựa chọn giữa “Plasma và Validium”: bất kỳ Validium nào cũng có thể nâng cao ít nhất một phần an toàn bằng cách tích hợp tính năng Plasma vào cơ chế thoát khỏi của nó. Sự tập trung của nghiên cứu là để EVM có được tính chất tốt nhất (từ yêu cầu tin cậy, chi phí Gas L1 tệ nhất và khả năng chống lại cuộc tấn công DoS, v.v.), cũng như cấu trúc ứng dụng thay thế cụ thể. Ngoài ra, so với Rollup, Plasma có độ phức tạp cao hơn về mặt khái niệm, điều này đòi hỏi giải quyết trực tiếp thông qua nghiên cứu và xây dựng một framework chung tốt hơn.
Trọng tâm chính của việc sử dụng Plasma thiết kế là nó phụ thuộc nhiều hơn vào người vận hành và khó khăn hơn để cân bằng, mặc dù thiết kế Plasma/Rollup kết hợp thường có thể tránh được điểm yếu này.
Làm thế nào để tương tác với các phần khác của lộ trình?
Khi giải pháp Plasma hoạt động hiệu quả hơn, áp lực về tính sẵn có của dữ liệu hiệu suất cao trên L1 cũng giảm đi. Việc chuyển hoạt động sang L2 cũng có thể giảm áp lực về MEV trên L1.
Hệ thống chứng minh L2 trưởng thành
Chúng tôi đang giải quyết vấn đề gì?
Hiện tại, hầu hết các Rollup thực tế vẫn chưa đáng tin cậy. Có một ủy ban an ninh có khả năng ghi đè lên hành vi của hệ thống chứng minh (lạc quan hoặc hợp lệ). Trong một số trường hợp, hệ thống chứng minh thậm chí không hoạt động hoặc chỉ có chức năng “tư vấn”. Các Rollup tiên tiến nhất bao gồm: (i) một số Rollup cụ thể cho các ứng dụng không đáng tin cậy như Fuel; (ii) Optimism và Arbitrum là hai Rollup toàn bộ EVM đã thực hiện một phần của cột mốc không đáng tin cậy được gọi là “giai đoạn một” cho đến khi bài viết này được viết. Lý do Rollup không tiến xa hơn là do lo ngại về sự tồn tại của lỗi trong mã. Chúng ta cần Rollup không đáng tin cậy nên phải đối mặt và giải quyết vấn đề này.
Nó là gì và hoạt động như thế nào?
Đầu tiên, hãy nhớ lại hệ thống “stage” được giới thiệu ban đầu trong bài viết này.
Giai đoạn 0: Người dùng phải có thể chạy Nút và đồng bộ hóa chuỗi. Nếu xác minh hoàn toàn đáng tin cậy / tập trung, thì cũng không sao.
Giai đoạn 1: Phải có hệ thống chứng minh (không cần tin cậy) để đảm bảo chỉ có giao dịch hợp lệ mới được chấp nhận. Cho phép có một ủy ban an ninh có thể lật đổ hệ thống chứng minh, nhưng phải có ngưỡng bỏ phiếu là 75%. Ngoài ra, một phần của quorum-blocking trong ủy ban (tức là 26% +) phải nằm ngoài công ty chính xây dựng Rollup. Cho phép sử dụng cơ chế nâng cấp yếu hơn (ví dụ như DAO), nhưng phải có đủ thời gian Trễ, để người dùng có thể rút tiền của mình trước khi các nâng cấp độc hại được phê duyệt.
Giai đoạn 2: Phải có một hệ thống chứng thực (không tin cậy) đảm bảo rằng chỉ các giao dịch hợp lệ mới được chấp nhận. Ủy ban an toàn chỉ được phép can thiệp nếu có lỗi có thể chứng minh được trong mã, ví dụ: Nếu hai hệ thống chứng thực dư thừa không nhất quán với nhau hoặc nếu một hệ thống chứng thực chấp nhận hai gốc hậu trạng thái khác nhau cho cùng một khối (hoặc không chấp nhận bất cứ điều gì trong một thời gian đủ dài, chẳng hạn như một tuần). Cơ chế leo thang được cho phép, nhưng phải có độ trễ dài.
Mục tiêu của chúng tôi là đạt được giai đoạn 2. Thách thức chính để đạt được giai đoạn 2 là giành đủ niềm tin, chứng minh hệ thống thực sự đáng tin cậy. Có hai phương pháp chính để thực hiện điều này:
Xác minh chính thức: Chúng ta có thể sử dụng toán học hiện đại và công nghệ tính toán để chứng minh (lạc quan và hợp lệ) hệ thống chứng minh chỉ chấp nhận các Khối tuân thủ quy định EVM. Các công nghệ này đã tồn tại trong nhiều thập kỷ, nhưng những tiến bộ gần đây (như Lean 4) đã làm cho chúng trở nên thực tế hơn và tiến bộ trong việc chứng minh được hỗ trợ bởi trí tuệ nhân tạo có thể làm tăng tốc thêm xu hướng này.
Đa chứng minh (Multi-provers): Tạo nhiều hệ thống chứng minh và đầu tư tiền vào những hệ thống chứng minh này cùng với ủy ban an toàn (hoặc các công cụ tin cậy khác như TEE). Nếu các hệ thống chứng minh đồng ý, ủy ban an toàn sẽ không có quyền lực; nếu họ không đồng ý, ủy ban an toàn chỉ có thể lựa chọn giữa chúng, và không thể áp đặt một câu trả lời của riêng mình.
Đồ thị chứng minh nhiều bằng chứng kết hợp một hệ thống chứng minh lạc quan, một hệ thống bằng chứng hợp lệ và một ủy ban an toàn.
Có liên kết nào với nghiên cứu hiện có không?
EVM K Semantics (công việc xác minh hình thức từ năm 2017):
Bài phát biểu về tư duy đa chứng minh (2022):
Kế hoạch Taiko sử dụng chứng minh đa lớp:
Còn gì cần phải làm? Có những sự cân nhắc nào?
Đối với Xác minh chính thức, công việc rất lớn. Chúng ta cần tạo ra phiên bản xác minh chính thức của toàn bộ SNARK chứng minh viên cho EVM. Đây là một dự án vô cùng phức tạp, mặc dù chúng ta đã bắt đầu thực hiện. Có một mẹo có thể giúp đơn giản hóa nhiệm vụ này một cách đáng kể: chúng ta có thể tạo ra một chứng minh viên SNARK đã được xác minh chính thức cho một Máy ảo tối thiểu (ví dụ như RISC-V hoặc Cairo), sau đó triển khai EVM trong Máy ảo tối thiểu này (và chứng minh hình thức tính tương đương của nó với các ETH Máy ảo quy định khác).
Đối với multi-proof, còn hai phần chính chưa hoàn thành. Trước hết, chúng ta cần đủ tin tưởng vào ít nhất hai hệ thống chứng minh khác nhau, đảm bảo rằng chúng đều an toàn đủ, và đảm bảo nếu chúng gặp vấn đề, thì các vấn đề này phải khác nhau và không liên quan (do đó chúng sẽ không xảy ra vấn đề cùng lúc). Thứ hai, chúng ta cần tin tưởng rất cao vào logic cơ bản của hệ thống chứng minh kết hợp. Phần mã này phải ít hơn nhiều. Có một số cách để làm cho nó rất nhỏ, chỉ cần lưu trữ tiền trong một hợp đồng an toàn nhiều chữ ký (Safe multisig) được biểu thị bởi các hệ thống chứng minh khác nhau, nhưng điều này sẽ tăng chi phí Gas on-chain. Chúng ta cần tìm thấy một sự cân bằng nào đó giữa hiệu suất và an toàn.
Làm thế nào để tương tác với các phần khác của lộ trình?
Chuyển hoạt động sang L2 có thể giảm áp lực MEV trên L1.
Cải thiện tương tác L2
Chúng tôi đang giải quyết vấn đề gì?
Một trong những thách thức chính mà hệ sinh thái L2 đang đối mặt là người dùng khó điều hướng trong đó. Ngoài ra, phương pháp đơn giản nhất thường lại giới thiệu lại giả định về sự tin cậy: tương tác chuỗi chéo tập trung, khách hàng RPC, v.v. Chúng ta cần khiến việc sử dụng hệ sinh thái L2 cảm giác như đang sử dụng một hệ sinh thái ETH gồm các chuỗi con thống nhất.
Nó là gì? Làm thế nào nó hoạt động?
Cải tiến tương tác L2 có nhiều loại. Lí thuyết, Ethereum tập trung vào Rollup và thực hiện Phân mảnh L1 là một điều. Hệ sinh thái L2 hiện tại của Ethereum vẫn còn những hạn chế so với trạng thái lý tưởng trong thực tế:
1、Địa chỉ của chuỗi cụ thể:Địa chỉ cần chứa thông tin chuỗi (L1、Optimism、Arbitrum……). Khi điều này được thực hiện, quy trình gửi qua L2 có thể được thực hiện bằng cách đơn giản đặt Địa chỉ vào trường “Gửi”, tại thời điểm này Ví tiền có thể tự xử lý cách gửi (bao gồm sử dụng giao thức Tương tác chuỗi chéo).
2、Yêu cầu thanh toán trên chuỗi cụ thể: Phải có thể dễ dàng và chuẩn hóa tạo ra thông điệp dưới dạng “Gửi tôi X token loại Y trên chuỗi Z”. Điều này chủ yếu có hai tình huống ứng dụng: (i) Thanh toán giữa người và người hoặc giữa người và dịch vụ cửa hàng; (ii) 01928374656574839201 yêu cầu tài chính.
3、Tương tác chuỗi chéo兑换和 gas 支付:应有一个标准化的开放giao thức来表达Tương tác chuỗi chéo操作,如「我将向在 Arbitrum 上向我发送 0.9999 个以太币的人发送 1 个以太币(在 Optimism 上)」,以及「我将向在 Arbitrum 上包含此交易的人发送 0.0001 个以太币(在 Optimism 上)」。ERC-7683 是对前者的尝试,而 RIP-7755 是对后者的尝试,尽管这两者的应用范围都比这些特定用例更广。
4、khách hàng ánh sáng: Người dùng nên có khả năng xác minh thực tế chuỗi mà họ đang tương tác, chứ không chỉ đơn giản tin tưởng vào nhà cung cấp RPC. Helios của a16z crypto có thể làm được điều này (đối với Ether chính nó), nhưng chúng ta cần mở rộng tính không tin cậy này lên L2. ERC-3668 (CCIP-read) là một chiến lược để đạt được mục tiêu này.
Làm thế nào để cập nhật header chain Ethereum của khách hàng ánh sáng. Khi có header chain, bạn có thể sử dụng chứng minh Merkle để xác minh bất kỳ đối tượng trạng thái nào. Khi bạn có đối tượng trạng thái L1 đúng, bạn có thể sử dụng chứng minh Merkle (nếu bạn muốn kiểm tra trước xác nhận, bạn cũng có thể sử dụng chữ ký) để xác minh bất kỳ đối tượng trạng thái nào trên L2. Helios đã làm được điều này. Mở rộng đến sau là một thách thức về tiêu chuẩn.
Keystore Ví tiền: Hiện nay, nếu bạn muốn cập nhật Chìa khoá bảo mật của Ví tiền để kiểm soát Hợp đồng thông minh của mình, bạn phải cập nhật trên tất cả các chuỗi mà Ví tiền đó tồn tại. Keystore Ví tiền là một công nghệ cho phép Chìa khoá bảo mật chỉ tồn tại tại một nơi (entweder auf L1 hoặc có thể ở L2 trong tương lai), sau đó bất kỳ L2 nào có bản sao của Ví tiền từ đó có thể đọc Chìa khoá bảo mật. Điều này có nghĩa là chỉ cần cập nhật một lần. Để tăng hiệu quả, Keystore Ví tiền yêu cầu L2 có một cách tiêu chuẩn để đọc thông tin trên L1 mà không có chi phí; có hai đề xuất cho điều này, đó là L1S LOAD và REMOTESTATICCALL.
Nguyên tắc hoạt động của Ví tiền Keystore
2、 Ý tưởng ‘Cầu nối Token chia sẻ’ táo bạo hơn: Hãy tưởng tượng một thế giới trong đó tất cả các L2 đều là Rollup bằng chứng hợp lệ và mỗi khe cắm đều gửi đến mạng Ethereum. Ngay cả trong thế giới như vậy, việc chuyển tài sản từ một L2 sang L2 khác vẫn đòi hỏi rút tiền và gửi tiền trong trạng thái nguyên bản, điều này cần phải trả một khoản phí Gas L1 lớn. Một cách giải quyết vấn đề này là tạo ra một Rollup chia sẻ đơn giản, chức năng duy nhất của nó là duy trì thông tin về việc mỗi loại Token thuộc về L2 nào và mỗi loại Token đó có số dư bao nhiêu, và cho phép cập nhật số dư này thông qua một loạt các giao dịch chuyển giao giữa các L2 được khởi xướng bởi bất kỳ L2 nào. Điều này sẽ giúp các giao dịch chuyển giao giữa các L2 không cần phải trả phí gas L1 mỗi lần chuyển giao và không cần sử dụng các công nghệ dựa trên nhà cung cấp thanh khoản như ERC-7683.
Tính chất tổ hợp đồng bộ: Cho phép gọi đồng bộ xảy ra giữa L2 cụ thể và L1 hoặc giữa nhiều L2. Điều này giúp cải thiện hiệu suất tài chính phi tập trung của giao thức DeFi. Đối với trường hợp trước, nó có thể được thực hiện mà không cần phối hợp chéo L2 nào; đối với trường hợp sau, cần chia sẻ thứ tự. Công nghệ dựa trên Rollup tự động áp dụng cho tất cả các công nghệ này.
Có liên kết nào với nghiên cứu hiện có không?
Địa chỉ chuỗi cụ thể:
ERC-3770:
ERC-7683:
RIP-7755:
Scroll keystore Ví tiền设计式样:
Helios:
ERC-3668 (đôi khi được gọi là CCIP đọc):
Đề xuất ‘Xác nhận trước (chia sẻ)’ dựa trên Justin Drake:
L1S LOAD (RIP-7728): tải trước biên dịch/20388
REMOTESTATICCALL trong Optimism:
AggLayer, bao gồm cả ý tưởng của cầu đường chung cho token:
Còn gì cần phải làm? Có những sự cân nhắc nào?
Nhiều ví dụ trên phải đối mặt với một vấn đề nan giải về tiêu chuẩn khi nào nên tiêu chuẩn hóa và lớp nào cần tiêu chuẩn hóa. Nếu bạn chuẩn hóa quá sớm, bạn có thể cố thủ một giải pháp kém. Nếu bạn chuẩn hóa quá muộn, bạn có thể tạo ra sự phân mảnh không cần thiết. Trong một số trường hợp, có một giải pháp ngắn hạn với các thuộc tính yếu hơn dễ thực hiện hơn và một giải pháp dài hạn “cuối cùng đúng” nhưng mất nhiều năm để đạt được.
Những nhiệm vụ này không chỉ là vấn đề kỹ thuật, chúng cũng là vấn đề xã hội (thậm chí có thể là chính vấn đề xã hội), cần sự hợp tác của L2 vàVí tiền cũng như L1.
Làm thế nào để tương tác với các phần khác của lộ trình?
大多数这些提案都是「更高层」结构,因此对L1层面的考虑影响不大。一个例外是共享排序,它对giá trị có thể trích xuất tối đa(MEV)有着重大影响。
Mở rộng thực hiện trên L1
Chúng tôi đang giải quyết vấn đề gì?
Nếu L2 trở nên rất mở rộng và thành công, nhưng L1 vẫn chỉ có thể xử lý một lượng khối lượng rất nhỏ, thì Ethereum có thể đối mặt với nhiều rủi ro:
Tính kinh tế của tài sản ETH sẽ trở nên biến động hơn, do đó sẽ ảnh hưởng đến bảo mật lâu dài của mạng.
2、Nhiều nền tảng L2 được hưởng lợi từ việc kết nối chặt chẽ với hệ sinh thái tài chính phát triển mạnh mẽ trên L1, nếu hệ sinh thái này bị suy yếu nghiêm trọng, sự thúc đẩy để trở thành L2 (thay vì trở thành L1 độc lập) sẽ giảm đi.
3、L2 cần một khoảng thời gian rất dài để đạt được bảo đảm an ninh hoàn toàn giống như L1.
Nếu L2 thất bại (ví dụ, do hành vi và biến mất của nhà khai thác), người dùng vẫn cần phải khôi phục tài sản của họ thông qua L1. Do đó, L1 cần đủ mạnh mẽ, ít nhất là có thể xử lý đôi khi các công việc phức tạp và rối ren của L2.
Vì những lý do này, việc mở rộng L1 và đảm bảo rằng nó có thể tiếp tục chứa đựng nhiều hơn và nhiều hơn các trường hợp sử dụng là rất có giá trị.
Nó là gì? Làm thế nào nó hoạt động?
Cách mở rộng đơn giản nhất là tăng giới hạn Gas trực tiếp. Tuy nhiên, điều này có thể làm cho L1 trở nên tập trung, do đó làm suy yếu một đặc tính quan trọng khác của ETHereum L1 mạnh mẽ: tính tin cậy của nó như một lớp cơ sở vững chắc. Vẫn còn tranh cãi về việc tăng giới hạn Gas đến mức nào là bền vững, và điều này cũng sẽ phụ thuộc vào việc triển khai những công nghệ khác nhau để làm cho việc xác minh Khối lớn hơn trở nên dễ dàng hơn (ví dụ, lịch sử hết hạn, không trạng thái, bằng chứng hợp lệ L1 EVM). Một điều quan trọng khác cần được cải thiện liên tục là hiệu suất của phần mềm khách hàng ETHereum, hiệu suất hiện tại cao hơn nhiều so với năm năm trước. Chiến lược tăng giới hạn Gas L1 hiệu quả sẽ liên quan đến việc tăng tốc sự phát triển của các công nghệ xác minh này.
EOF: một định dạng bytecode EVM mới, thân thiện với phân tích tĩnh và có thể thực hiện nhanh hơn. Với những cải tiến hiệu suất này, bytecode EOF có thể được tính phí gas thấp hơn.
Định giá Gas đa chiều: Đặt ra các chi phí cơ bản và giới hạn khác nhau cho tính toán, dữ liệu và lưu trữ, có thể tăng dung lượng trung bình của L1 của Ethereum mà không tăng tối đa (do đó tránh tạo ra rủi ro an ninh mới).
Giảm chi phí gas cho các mã opcode và biên dịch trước cụ thể - Trong lịch sử, chúng tôi đã tăng chi phí gas của một số hoạt động được định giá thấp nhiều lần để tránh các cuộc tấn công từ chối dịch vụ. Có thể làm nhiều hơn nữa để giảm phí gas cho các opcode quá đắt. Ví dụ, phép cộng rẻ hơn nhiều so với phép nhân, nhưng hiện tại chi phí của mã opcode ADD và MUL là như nhau. Chúng tôi có thể giảm chi phí ADD và thậm chí làm cho các opcode đơn giản hơn như PUSH rẻ hơn. EOF nói chung được tối ưu hóa hơn về vấn đề này.
EVM-MAX và SIMD: EVM-MAX là một đề xuất cho phép tính toán số lớn nguyên mô đun hiệu quả hơn như một module độc lập của EVM. Giá trị tính toán của EVM-MAX chỉ có thể được truy cập bởi các opcode EVM-MAX khác trừ khi có ý định xuất ra. Điều này cho phép có không gian lớn hơn để tối ưu hóa việc lưu trữ các giá trị này. SIMD (single instruction multiple data) là một đề xuất cho phép thực hiện cùng một chỉ thị hiệu quả trên một mảng giá trị. Cả hai cùng nhau có thể tạo ra một bộ xử lý phụ mạnh mẽ bên cạnh EVM, được sử dụng để thực hiện mã hóa hiệu quả hơn. Điều này đặc biệt hữu ích cho các giao thức bảo mật và hệ thống bảo vệ L2, và do đó sẽ giúp mở rộng L1 và L2.
Những cải tiến này sẽ được thảo luận kỹ hơn trong các bài viết Splurge sau này.
Cuối cùng, chiến lược thứ ba là Rollups bản gốc (hoặc rollups được khẳng định): Về bản chất, tạo ra nhiều bản sao EVM chạy song song, từ đó tạo ra một mô hình tương đương với Rollup có thể cung cấp, nhưng tích hợp nhiều hơn vào giao thức bản gốc.
Có liên kết nào với nghiên cứu hiện có không?
Lộ trình mở rộng ETH L1 của Polynya:
Định giá Gas đa chiều:
EIP-7706:
*EOF:
EVM-MAX:
SIMD:
Native rollups:
Max Resnick phỏng vấn về giá trị mở rộng L1:
Justin Drake về việc mở rộng quy mô với SNARK và bản tổng hợp gốc:
Còn cần làm gì, có những sự cân nhắc nào?
L1 mở rộng có ba chiến lược, có thể thực hiện độc lập hoặc song song:
Cải tiến công nghệ (ví dụ như mã khách hàng, khách hàng không trạng thái, lịch sử hết hạn) để làm cho L1 dễ dàng xác minh hơn, sau đó tăng giới hạn gas.
Thả成本 cụ thể của hoạt động để tăng dung lượng trung bình mà không tăng nguy cơ tình huống tồi nhất;
Rollups gốc (tức là, tạo N bản sao song song của EVM).
Hiểu về những công nghệ khác nhau này, chúng ta sẽ thấy rằng mỗi công nghệ có những lợi ích và nhược điểm riêng. Ví dụ, Rollups nguyên bản có nhiều yếu điểm tương tự như Rollups thông thường trong việc kết hợp: bạn không thể gửi một giao dịch đơn lẻ để đồng bộ hóa các hoạt động trên nhiều Rollup, giống như bạn có thể làm trên một hợp đồng trên L1 (hoặc L2) cùng một lúc. Tăng giới hạn Gas sẽ làm suy yếu những lợi ích khác mà việc xác minh đơn giản trên L1 có thể đạt được, như tăng tỷ lệ người dùng kiểm tra nút và số lượng solo staker. Tùy thuộc vào cách triển khai, việc làm cho một số thao tác cụ thể trong EVM (Máy ảo Ethereum) rẻ hơn có thể làm tăng tính phức tạp của EVM.
Một câu hỏi quan trọng mà bất kỳ kế hoạch mở rộng L1 nào cũng cần trả lời là: Tầm nhìn cuối cùng của L1 và L2 là gì? Rõ ràng, việc đặt tất cả nội dung trên L1 là điều vô lý: các tình huống ứng dụng tiềm năng có thể liên quan đến hàng trăm nghìn giao dịch mỗi giây, điều này sẽ làm cho L1 không thể xác minh hoàn toàn (trừ khi chúng ta áp dụng Rollup nguyên bản). Nhưng chúng ta thực sự cần một số nguyên tắc hướng dẫn để đảm bảo chúng ta không rơi vào tình thế như vậy: Tăng giới hạn Gas lên 10 lần, gây thiệt hại nghiêm trọng cho phi tập trung của Ethereum L1.
Một quan điểm về phân công giữa L1 và L2
Làm thế nào để tương tác với các phần khác của lộ trình?
Đưa thêm người dùng vào L1 không chỉ có nghĩa là cải thiện khả năng mở rộng, mà còn có nghĩa là cải thiện các khía cạnh khác của L1. Điều này có nghĩa là nhiều hơn MEV sẽ được giữ lại trên L1 (thay vì chỉ là vấn đề của L2), do đó, nhu cầu xử lý MEV một cách rõ ràng sẽ trở nên cấp bách hơn. Điều này sẽ tăng đáng kể giá trị thời gian khe nhanh trên L1. Đồng thời, điều này cũng phụ thuộc lớn vào việc xác minh L1 (Verge) diễn ra thuận lợi.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Bài viết mới của Vitalik: Tương lai tiềm năng của Ethereum, The Surge
Tác giả gốc: Vitalik Buterin
原文编译:Karen,Foresight News
Đặc biệt cảm ơn Justin Drake, Francesco, Hsiao-wei Wang, @antonttc và Georgios Konstantopoulos.
Ban đầu, trong bản đồ đường của Ethereum có hai chiến lược mở rộng. Một chiến lược (xem bản báo cáo sớm năm 2015) là “Phân mảnh” (sharding): Mỗi Nút chỉ cần xác minh và lưu trữ một phần nhỏ giao dịch, thay vì xác minh và lưu trữ tất cả giao dịch trên chuỗi. Bất kỳ mạng ngang hàng nào khác (ví dụ BitTorrent) cũng hoạt động theo cách này, vì vậy chúng ta dĩ nhiên có thể làm cho blockchain hoạt động theo cách tương tự. Một chiến lược khác là giao thức Layer 2: Các mạng này sẽ nằm phía trên Ethereum, cho phép nó tận dụng đầy đủ tính bảo mật, đồng thời giữ một phần lớn dữ liệu và tính toán ngoài Chuỗi chính. Giao thức Layer 2 đề cập đến state channels năm 2015, Plasma năm 2017, và sau đó là Rollup năm 2019. Rollup mạnh mẽ hơn state channels hoặc Plasma, nhưng chúng cần băng thông dữ liệu on-chain lớn. May mắn thay, đến năm 2019, nghiên cứu Phân mảnh đã giải quyết vấn đề “tính khả dụng” của việc xác minh quy mô lớn. Kết quả là, hai con đường hòa nhập và chúng ta có được bản đồ đường với Rollup ở trung tâm, bản đồ đường mà ngày nay vẫn là chiến lược mở rộng của Ethereum.
The Surge, bản đồ con đường 2023
Lộ trình tập trung vào Rollup đề xuất một phân công đơn giản: ETH là tầng L1 tập trung vào việc trở thành một lớp cơ sở mạnh mẽ và phi tập trung, trong khi L2 đảm nhận nhiệm vụ giúp hệ sinh thái mở rộng. Mô hình này tồn tại ở khắp mọi nơi trong xã hội: sự tồn tại của hệ thống tòa án (L1) không phải là để đạt được tốc độ siêu cao và hiệu quả cao, mà là để bảo vệ hợp đồng và quyền sở hữu, trong khi các nhà khởi nghiệp (L2) phải xây dựng trên một nền tảng cơ bản vững chắc này, dẫn dắt loài người tiến đến sao Hỏa (cả về nghĩa đen và ẩn dụ).
Trong năm nay, bản đồ tập trung vào Rollup đã đạt được những thành tựu quan trọng: với việc triển khai các blobs EIP-4844, băng thông dữ liệu của ETH L1 đã tăng đáng kể, và nhiều sự đa dạng hóa của Máy ảo Ethereum (EVM) Rollup đã bước vào giai đoạn đầu tiên. Mỗi L2 tồn tại như một ‘Phân mảnh’ với các quy tắc và logic nội bộ riêng, và việc đa dạng hóa cách thức triển khai Phân mảnh hiện đã trở thành hiện thực. Tuy nhiên, như chúng ta đã thấy, việc đi đường này cũng đối mặt với một số thách thức đặc biệt. Do đó, nhiệm vụ hiện tại của chúng ta là hoàn thiện bản đồ tập trung vào Rollup và giải quyết những vấn đề này, đồng thời duy trì tính ổn định và tính Phi tập trung đặc biệt của ETH L1.
The Surge: Mục Tiêu Chính
Trong tương lai, Ethereum có thể đạt hơn 100.000 TPS thông qua L2;
Giữ tính phi tập trung và tính ổn định của L1;
3、Ít nhất một số L2 hoàn toàn thừa hưởng các thuộc tính cốt lõi của Ethereum (Không đáng tin cậy, mở, chống kiểm duyệt);
Nội dung chương này
Nghịch lý tam giác mở rộng
Nút mạng có chi phí thấp hơn (cụ thể hơn là: chi phí hoạt động của Nút thấp), số lượng giao dịch xử lý nhiều và An toàn (kẻ tấn công cần phá hủy một phần lớn của Nút mạng để giao dịch thất bại).
Điều đáng chú ý là, Paradox tam giác không phải là một định lý, và bài viết giới thiệu về Paradox tam giác cũng không đi kèm với bất kỳ chứng minh toán học nào. Nó thực sự đưa ra một luận điểm toán học theo cảm hứng: nếu một Nút thân thiện với Phi tập trung (ví dụ: máy tính xách tay tiêu dùng) có thể xác minh N giao dịch mỗi giây, và bạn có một chuỗi xử lý k*N giao dịch mỗi giây, thì (i) mỗi giao dịch chỉ có thể được nhìn thấy bởi 1/k Nút, điều này có nghĩa là kẻ tấn công chỉ cần phá hủy một số ít Nút là có thể thông qua một giao dịch độc hại, hoặc (ii) Nút của bạn sẽ trở nên mạnh mẽ, trong khi chuỗi của bạn không sẽ trở nên Phi tập trung. Mục đích của bài viết này không phải là chứng minh việc phá vỡ Paradox tam giác là không thể; ngược lại, mục tiêu của nó là cho thấy việc phá vỡ Paradox tam giác là khó khăn, nó đòi hỏi phải thoát khỏi khung tư duy ngầm định của luận điệu đó một cách nào đó.
Trong nhiều năm qua, một số chuỗi hiệu suất cao thường tuyên bố rằng họ đã giải quyết được ba mâu thuẫn trong khi không thay đổi cơ sở kiến trúc, thường thông qua việc tối ưu hóa Nút bằng các kỹ thuật kỹ thuật phần mềm. Điều này luôn luôn gây hiểu lầm, vì việc vận hành Nút on-chain này khó khăn hơn nhiều so với việc vận hành Nút trên ETH. Bài viết này sẽ thảo luận về lý do tại sao lại như vậy, cũng như tại sao chỉ bằng kỹ thuật kỹ thuật phần mềm L1 không thể mở rộng ETH?
Tuy nhiên, việc kết hợp lấy mẫu sẵn có dữ liệu với SNARKs thực sự giải quyết được nghịch lý tam giác: nó cho phép máy khách xác minh rằng một số lượng nhất định dữ liệu có sẵn và một số lượng nhất định bước tính toán được thực hiện đúng trong trường hợp chỉ cần tải xuống một lượng nhỏ dữ liệu và thực hiện một lượng rất ít tính toán. SNARKs là không cần tin cậy. Lấy mẫu sẵn có dữ liệu có mô hình tin cậy few-of-N tinh tế, nhưng nó vẫn giữ các đặc tính cơ bản của chuỗi không mở rộng, nghĩa là ngay cả khi tấn công 51% cũng không thể buộc các khối xấu được mạng chấp nhận.
Một phương pháp khác để giải quyết tình trạng khó khăn ba là kiến trúc Plasma, nó sử dụng công nghệ tinh vi để chuyển trách nhiệm theo dõi sự khả dụng dữ liệu cho người dùng một cách khích lệ mà tương thích. Vào thời kỳ 2017-2019, khi chúng ta chỉ có cách để mở rộng khả năng tính toán là bằng chứng gian lận, kiến trúc Plasma bị hạn chế rất nhiều về mặt an toàn, nhưng với sự phổ biến của SNARKs (chứng minh không chứng minh tương tác không chi tiết), kiến trúc Plasma trở nên khả thi hơn đối với nhiều trường hợp sử dụng hơn so với trước đây.
Sự tiến triển tiếp theo của việc lấy mẫu sẵn có dữ liệu
Chúng tôi đang giải quyết vấn đề gì?
Ngày 13 tháng 3 năm 2024, khi Dencun nâng cấp và ra mắt, mỗi slot trên blockchain của ETH sẽ có khoảng 3 blob có kích thước khoảng 125 kB trong 12 giây, hoặc băng thông dữ liệu khoảng 375 kB cho mỗi slot. Giả sử dữ liệu giao dịch được công bố trực tiếp trên on-chain, việc chuyển tiền ERC 20 sẽ chiếm khoảng 180 byte, do đó TPS tối đa trên Rollup của ETH là: 375000 / 12 / 180 = 173.6 TPS
Nếu chúng ta thêm calldata của Ethereum (giá trị lý thuyết tối đa: mỗi khe 30 triệu Gas / mỗi byte 16 gas = mỗi khe 1.875.000 byte), thì tốc độ sẽ tăng lên 607 TPS. Sử dụng PeerDAS, số lượng blob có thể tăng lên 8-16, điều này sẽ cung cấp 463-926 TPS cho calldata.
Đây là một cải tiến quan trọng đối với ETH L1, nhưng vẫn chưa đủ. Chúng tôi muốn có thêm tính mở rộng. Mục tiêu trung hạn của chúng tôi là mỗi slot 16 MB, nếu kết hợp với cải tiến nén dữ liệu Rollup, sẽ mang lại khoảng 58000 TPS.
Nó là gì? Làm thế nào để chạy?
PeerDAS là một triển khai tương đối đơn giản của “lấy mẫu 1 D”. Trong ETH, mỗi blob là một đa thức bậc 4096 trên trường nguyên tố 253 bit. Chúng tôi phát các cổ phiếu của đa thức, trong đó mỗi phần chứa 16 giá trị được đánh giá từ 16 tọa độ liền kề trong tổng số 8192 tọa độ. Trong số 8192 giá trị đánh giá này, bất kỳ 4096 nào (theo các thông số được đề xuất hiện tại: 64 trong số 128 mẫu có thể) đều có thể phục hồi các đốm màu.
Nguyên lý hoạt động của PeerDAS là cho mỗi client lắng nghe một số mạng con, trong đó mạng con thứ i phát sóng bất kỳ blob thứ i nào và yêu cầu các blob khác trên các mạng con khác thông qua việc hỏi các đối tác trên mạng toàn cầu p2p (người sẽ nghe các mạng con khác nhau). Phiên bản thận trọng hơn SubnetDAS chỉ sử dụng cơ chế mạng con mà không có lớp hỏi đối tác bổ sung. Đề xuất hiện tại là để các Nút tham gia Bằng chứng về cổ phần sử dụng SubnetDAS, trong khi các Nút khác (tức là client) sử dụng PeerDAS.
Về mặt lý thuyết, chúng ta có thể mở rộng quy mô “lấy mẫu 1 D” lên khá lớn: nếu chúng ta tăng số lượng blob tối đa lên 256 (với mục tiêu là 128), thì chúng ta có thể đạt được mục tiêu 16 MB và 16 mẫu trên mỗi Nút trong lấy mẫu dữ liệu sẵn có * 128 blob trên mỗi blob 512 byte mỗi mẫu = 1 MB băng thông dữ liệu trên mỗi khe. Điều này hầu như không nằm trong khả năng chịu đựng của chúng tôi: nó có thể thực hiện được, nhưng điều đó có nghĩa là các máy khách bị hạn chế về băng thông không thể lấy mẫu. Chúng ta có thể tối ưu hóa điều này ở một mức độ nào đó bằng cách giảm số lượng blob và tăng kích thước blob, nhưng điều này làm cho việc xây dựng lại tốn kém hơn.
Vì vậy, chúng tôi muốn tiến xa hơn và thực hiện mẫu 2D (2D sampling), phương pháp này không chỉ thực hiện lấy mẫu ngẫu nhiên trong blob mà còn giữa các blob. Sử dụng tính chất tuyến tính của cam kết KZG, mở rộng tập hợp blob trong một khối thông qua một nhóm blob ảo mới, các blob ảo này mã hóa thông tin trùng lặp.
Vì vậy, cuối cùng chúng tôi muốn đi một bước xa hơn và thực hiện mẫu 2D, không chỉ trong blob mà còn giữa các blob ngẫu nhiên. Thuộc tính tuyến tính của KZG được sử dụng để mở rộng tập hợp các blob trong một Khối, bao gồm danh sách blob ảo mới mã hóa dự phòng cho cùng thông tin.![Vitalik新文:以太坊可能的未来,The Surge]()
2D lấy mẫu. Nguồn dữ liệu: a16z crypto
Quan trọng nhất là, việc mở rộng cam kết tính toán không cần có blob, do đó, phương án này thân thiện với xây dựng Khối phân tán. Các nút thực tế xây dựng Khối chỉ cần có cam kết KZG blob và họ có thể dựa vào việc lấy mẫu tính sẵn sẵn có (DAS) để xác minh tính khả dụng của khối dữ liệu. Việc lấy mẫu tính sẵn khả dụng dữ liệu một chiều (1D DAS) cũng thân thiện với xây dựng khối phân tán.
Có liên kết nào với nghiên cứu hiện có không?
Cần làm gì tiếp theo? Còn những sự cân nhắc nào khác?
Tiếp theo là hoàn thiện và triển khai PeerDAS. Sau đó, tiếp tục tăng số lượng blob trên PeerDAS và cùng lúc quan sát mạng và cải thiện phần mềm để đảm bảo an toàn, đây là quá trình dần dần. Đồng thời, chúng tôi hy vọng có nhiều công việc học thuật hơn để điều chỉnh PeerDAS và các phiên bản DAS khác cũng như tương tác với quy tắc lựa chọn fork và các vấn đề an ninh khác.
Xa hơn nữa, chúng ta cần phải làm nhiều việc hơn để xác định phiên bản lý tưởng của DAS 2D và chứng minh các đặc tính an toàn của nó. Chúng tôi cũng hy vọng cuối cùng sẽ chuyển từ KZG sang một giải pháp thay thế an toàn lượng tử mà không yêu cầu thiết lập đáng tin cậy. Tại thời điểm này, vẫn chưa rõ ứng cử viên nào thân thiện với các bản dựng được phân phối. Ngay cả việc sử dụng các kỹ thuật “brute force” đắt tiền, tức là STARK đệ quy để tạo ra bằng chứng hợp lệ để tái tạo các hàng và cột, là không đủ, bởi vì trong khi về mặt kỹ thuật, STARK có kích thước của hàm băm O (log (n) * log (log (n)) (sử dụng STIR), STARK thực sự lớn gần bằng toàn bộ blob.
Con đường thực tế dài hạn mà tôi coi là:
Vui lòng lưu ý rằng, ngay cả khi chúng tôi quyết định mở rộng trực tiếp trên tầng L1, sự lựa chọn này vẫn tồn tại. Điều này bởi vì nếu tầng L1 phải xử lý một lượng lớn TPS, Khối L1 sẽ trở nên rất lớn, người dùng sẽ muốn có một cách hiệu quả để xác minh tính chính xác của chúng, do đó chúng tôi sẽ phải sử dụng công nghệ giống như Rollup (như ZK-EVM và DAS) tại tầng L1.
Làm thế nào để tương tác với các phần khác của lộ trình?
Nếu triển khai nén dữ liệu, nhu cầu của 2D DAS sẽ giảm đi hoặc ít nhất sẽ bị trễ, nếu Plasma được sử dụng rộng rãi, nhu cầu sẽ giảm thêm. DAS cũng đặt ra thách thức đối với fork và cơ chế xây dựng giao thức phân tán: mặc dù về lý thuyết, DAS thân thiện với việc xây dựng phân tán, nhưng điều này cần phối hợp với đề xuất danh sách inclusion package và cơ chế lựa chọn fork xung quanh nó khi thực hiện.
Nén dữ liệu
Chúng tôi đang giải quyết vấn đề gì?
Mỗi giao dịch trong Rollup đều chiếm một lượng không gian dữ liệu on-chain lớn: Việc chuyển đổi ERC 20 tốn khoảng 180 byte. Ngay cả khi có mẫu sẵn có lý tưởng, điều này cũng giới hạn tính mở rộng của giao thức Layer. Mỗi khe 16 MB, chúng ta có được:
16000000 / 12 / 180 = 7407 TPS
Nếu chúng ta không chỉ có thể giải quyết vấn đề của tử số mà còn có thể giải quyết vấn đề của mẫu số, làm cho giao dịch trong mỗi Rollup chiếm ít byte hơn trên chuỗi, thì sẽ thế nào?
Nó là gì, làm thế nào hoạt động?
Theo tôi, phản ánh tốt nhất là bức ảnh từ hai năm trước:
Trong quá trình nén byte không, chúng tôi thay thế mỗi chuỗi byte không dài bằng hai byte để biểu thị có bao nhiêu byte không. Hơn nữa, chúng tôi sử dụng các thuộc tính cụ thể của giao dịch:
Ký tục hợp: Chúng tôi đã chuyển từ chữ ký ECDSA sang chữ ký BLS, đặc điểm của chữ ký BLS là nhiều chữ ký có thể được kết hợp thành một chữ ký duy nhất, chữ ký này có thể chứng minh tính hiệu lực của tất cả các chữ ký gốc. Ở lớp L1, vì tính toán chi phí xác minh là cao ngay cả khi kết hợp, nên không xem xét việc sử dụng chữ ký BLS. Nhưng trong môi trường ít dữ liệu như L2, việc sử dụng chữ ký BLS là có ý nghĩa. Đặc điểm kết hợp của ERC-4337 cung cấp một cách để thực hiện chức năng này.
Sử dụng con trỏ thay thế 01928374656574839201: Nếu trước đây bạn đã sử dụng một 01928374656574839201, chúng ta có thể thay thế 20 byte của 01928374656574839201 bằng con trỏ 4 byte trỏ đến vị trí trong lịch sử.
Độ trượt tùy chỉnh của giá trị giao dịch - Hầu hết các giá trị giao dịch có số chữ số rất ít, ví dụ, 0,25 ETH được biểu thị bằng 250.000.000.000.000.000 wei. Phí giao dịch cơ bản tối đa và phí ưu tiên cũng tương tự. Do đó, chúng ta có thể sử dụng định dạng số thập phân tùy chỉnh để biểu diễn hầu hết các giá trị tiền tệ.
Có liên kết nào với nghiên cứu hiện có không?
Còn cần làm gì, có những sự cân nhắc nào?
Điều tiếp theo cần làm là thực sự thực hiện kịch bản trên. Sự đánh đổi chính bao gồm:
Chuyển sang chữ ký BLS đòi hỏi nỗ lực lớn và sự tương thích với chip phần cứng đáng tin cậy để tăng cường tính bảo mật. Nó có thể được thay thế bằng gói ZK-SNARK hỗ trợ các phương pháp ký khác.
Nén động (ví dụ, thay thế bằng con trỏ) sẽ làm cho mã nguồn khách hàng trở nên phức tạp.
3、đưa sự khác biệt về trạng thái lên on-chain thay vì giao dịch, sẽ Thả tính khả kiểm tra và khiến nhiều phần mềm (ví dụ như khám phá blockchain) không thể hoạt động.
Làm thế nào để tương tác với các phần khác của bản đồ đường đi?
Sử dụng ERC-4337 và cuối cùng sẽ đưa một phần nội dung của nó vào L2 EVM, có thể làm tăng tốc độ triển khai công nghệ tổng hợp một cách đáng kể. Việc đặt một phần nội dung của ERC-4337 trên L1 có thể làm tăng tốc độ triển khai của nó trên L2.
Plasma Tổng Quát
Chúng tôi đang giải quyết vấn đề gì?
Ngay cả khi sử dụng 16 MB của blob và nén dữ liệu, 58,000 TPS cũng không đủ để đáp ứng hoàn toàn nhu cầu thanh toán của người tiêu dùng, mạng xã hội Phi tập trung hay các lĩnh vực có băng thông cao khác, đặc biệt là khi chúng ta bắt đầu xem xét yếu tố riêng tư, điều này có thể làm tăng khả năng mở rộng lên 3-8 lần. Đối với các tình huống ứng dụng có khối lượng giao dịch cao và giá trị thấp, lựa chọn hiện tại là sử dụng Validium, nơi dữ liệu được lưu trữ off-chain và áp dụng một mô hình an toàn thú vị: nhà điều hành không thể lấy cắp tiền của người dùng, nhưng họ có thể tạm thời hoặc vĩnh viễn đóng băng tài khoản của tất cả người dùng. Nhưng chúng ta có thể làm tốt hơn.
Nó là gì và hoạt động như thế nào?
Plasma là một giải pháp mở rộng, nó liên quan đến việc một nhà khai thác đưa Khối ra khỏi chuỗi và đặt các Merkle root của những Khối này lên chuỗi (khác với Rollup, Rollup sẽ đặt toàn bộ Khối lên chuỗi). Đối với mỗi Khối, nhà khai thác sẽ gửi cho mỗi người dùng một nhánh Merkle để chứng minh tài sản của người dùng đã thay đổi như thế nào, hoặc không thay đổi. Người dùng có thể rút tài sản của họ bằng cách cung cấp nhánh Merkle. Quan trọng là, nhánh này không nhất thiết phải có Merkle root mới nhất. Do đó, ngay cả khi sự sẵn có của dữ liệu gặp vấn đề, người dùng vẫn có thể khôi phục tài sản của họ bằng cách rút tài sản có sẵn mới nhất của họ. Nếu người dùng gửi một nhánh không hợp lệ (ví dụ, rút tài sản họ đã gửi cho người khác, hoặc nhà khai thác tự tạo ra một tài sản từ không), thì có thể thông qua cơ chế thách thức trên chuỗi để xác định quyền sở hữu hợp lệ của tài sản.
Sơ đồ Plasma Cash Chain. Giao dịch sử dụng đồng tiền i được đặt ở vị trí thứ i trên cây. Trong ví dụ này, giả sử tất cả các cây trước đó đều hợp lệ, chúng ta biết rằng Eve hiện đang sở hữu Token 1, David sở hữu Token 4, George sở hữu Token 6.
Phiên bản Plasma ban đầu chỉ có thể xử lý các trường hợp thanh toán và không thể mở rộng hiệu quả hơn. Tuy nhiên, nếu chúng ta yêu cầu mỗi gốc được xác minh bằng SNARK, thì Plasma sẽ mạnh mẽ hơn nhiều. Mỗi trò chơi thách thức có thể được đơn giản hóa đáng kể vì chúng ta loại bỏ hầu hết các con đường có thể gian lận của nhà khai thác. Đồng thời, cũng mở ra những con đường mới, cho phép Plasma mở rộng sang các loại tài sản rộng hơn. Cuối cùng, trong trường hợp nhà khai thác không gian lừa đảo, người dùng có thể rút tiền ngay lập tức mà không cần chờ đợi thời gian thách thức một tuần.
Một phương pháp để tạo ra một chuỗi EVM Plasma (không phải là phương pháp duy nhất): sử dụng ZK-SNARK để xây dựng một cây UTXO song song, cây này phản ánh sự thay đổi cân bằng được thực hiện bởi EVM và xác định ánh xạ duy nhất của ‘Token’ cùng một tại các thời điểm khác nhau trong lịch sử. Sau đó, có thể xây dựng cấu trúc Plasma trên nó.
Một cái nhìn quan trọng là hệ thống Plasma không cần phải hoàn hảo. Ngay cả khi bạn chỉ có thể bảo vệ một phần nhỏ tài sản (ví dụ như Token không di chuyển trong tuần qua), bạn cũng đã cải thiện đáng kể tình trạng hiện tại của EVM siêu mở rộng (gọi là Validium).
Một loại cấu trúc khác là Plasma/Rollup kết hợp, ví dụ như Intmax. Cấu trúc này đặt một lượng dữ liệu rất nhỏ của mỗi người dùng lên chuỗi (ví dụ, 5 byte) để đạt được một số tính năng nằm giữa Plasma và Rollup: trong trường hợp của Intmax, bạn có thể đạt được tính mở rộng và tính riêng tư rất cao, mặc dù lý thuyết chỉ giới hạn trong khoảng 16,000,000 / 12 / 5 = 266,667 TPS ngay cả trong dung lượng 16 MB.
Có những liên kết liên quan đến nghiên cứu hiện có nào?
Còn gì cần phải làm? Có những sự cân nhắc nào?
Nhiệm vụ chính còn lại là triển khai hệ thống Plasma vào ứng dụng thực tế. Như đã nói ở trên, Plasma không phải là sự lựa chọn giữa “Plasma và Validium”: bất kỳ Validium nào cũng có thể nâng cao ít nhất một phần an toàn bằng cách tích hợp tính năng Plasma vào cơ chế thoát khỏi của nó. Sự tập trung của nghiên cứu là để EVM có được tính chất tốt nhất (từ yêu cầu tin cậy, chi phí Gas L1 tệ nhất và khả năng chống lại cuộc tấn công DoS, v.v.), cũng như cấu trúc ứng dụng thay thế cụ thể. Ngoài ra, so với Rollup, Plasma có độ phức tạp cao hơn về mặt khái niệm, điều này đòi hỏi giải quyết trực tiếp thông qua nghiên cứu và xây dựng một framework chung tốt hơn.
Trọng tâm chính của việc sử dụng Plasma thiết kế là nó phụ thuộc nhiều hơn vào người vận hành và khó khăn hơn để cân bằng, mặc dù thiết kế Plasma/Rollup kết hợp thường có thể tránh được điểm yếu này.
Làm thế nào để tương tác với các phần khác của lộ trình?
Khi giải pháp Plasma hoạt động hiệu quả hơn, áp lực về tính sẵn có của dữ liệu hiệu suất cao trên L1 cũng giảm đi. Việc chuyển hoạt động sang L2 cũng có thể giảm áp lực về MEV trên L1.
Hệ thống chứng minh L2 trưởng thành
Chúng tôi đang giải quyết vấn đề gì?
Hiện tại, hầu hết các Rollup thực tế vẫn chưa đáng tin cậy. Có một ủy ban an ninh có khả năng ghi đè lên hành vi của hệ thống chứng minh (lạc quan hoặc hợp lệ). Trong một số trường hợp, hệ thống chứng minh thậm chí không hoạt động hoặc chỉ có chức năng “tư vấn”. Các Rollup tiên tiến nhất bao gồm: (i) một số Rollup cụ thể cho các ứng dụng không đáng tin cậy như Fuel; (ii) Optimism và Arbitrum là hai Rollup toàn bộ EVM đã thực hiện một phần của cột mốc không đáng tin cậy được gọi là “giai đoạn một” cho đến khi bài viết này được viết. Lý do Rollup không tiến xa hơn là do lo ngại về sự tồn tại của lỗi trong mã. Chúng ta cần Rollup không đáng tin cậy nên phải đối mặt và giải quyết vấn đề này.
Nó là gì và hoạt động như thế nào?
Đầu tiên, hãy nhớ lại hệ thống “stage” được giới thiệu ban đầu trong bài viết này.
Giai đoạn 0: Người dùng phải có thể chạy Nút và đồng bộ hóa chuỗi. Nếu xác minh hoàn toàn đáng tin cậy / tập trung, thì cũng không sao.
Giai đoạn 1: Phải có hệ thống chứng minh (không cần tin cậy) để đảm bảo chỉ có giao dịch hợp lệ mới được chấp nhận. Cho phép có một ủy ban an ninh có thể lật đổ hệ thống chứng minh, nhưng phải có ngưỡng bỏ phiếu là 75%. Ngoài ra, một phần của quorum-blocking trong ủy ban (tức là 26% +) phải nằm ngoài công ty chính xây dựng Rollup. Cho phép sử dụng cơ chế nâng cấp yếu hơn (ví dụ như DAO), nhưng phải có đủ thời gian Trễ, để người dùng có thể rút tiền của mình trước khi các nâng cấp độc hại được phê duyệt.
Giai đoạn 2: Phải có một hệ thống chứng thực (không tin cậy) đảm bảo rằng chỉ các giao dịch hợp lệ mới được chấp nhận. Ủy ban an toàn chỉ được phép can thiệp nếu có lỗi có thể chứng minh được trong mã, ví dụ: Nếu hai hệ thống chứng thực dư thừa không nhất quán với nhau hoặc nếu một hệ thống chứng thực chấp nhận hai gốc hậu trạng thái khác nhau cho cùng một khối (hoặc không chấp nhận bất cứ điều gì trong một thời gian đủ dài, chẳng hạn như một tuần). Cơ chế leo thang được cho phép, nhưng phải có độ trễ dài.
Mục tiêu của chúng tôi là đạt được giai đoạn 2. Thách thức chính để đạt được giai đoạn 2 là giành đủ niềm tin, chứng minh hệ thống thực sự đáng tin cậy. Có hai phương pháp chính để thực hiện điều này:
Đồ thị chứng minh nhiều bằng chứng kết hợp một hệ thống chứng minh lạc quan, một hệ thống bằng chứng hợp lệ và một ủy ban an toàn.
Có liên kết nào với nghiên cứu hiện có không?
Còn gì cần phải làm? Có những sự cân nhắc nào?
Đối với Xác minh chính thức, công việc rất lớn. Chúng ta cần tạo ra phiên bản xác minh chính thức của toàn bộ SNARK chứng minh viên cho EVM. Đây là một dự án vô cùng phức tạp, mặc dù chúng ta đã bắt đầu thực hiện. Có một mẹo có thể giúp đơn giản hóa nhiệm vụ này một cách đáng kể: chúng ta có thể tạo ra một chứng minh viên SNARK đã được xác minh chính thức cho một Máy ảo tối thiểu (ví dụ như RISC-V hoặc Cairo), sau đó triển khai EVM trong Máy ảo tối thiểu này (và chứng minh hình thức tính tương đương của nó với các ETH Máy ảo quy định khác).
Đối với multi-proof, còn hai phần chính chưa hoàn thành. Trước hết, chúng ta cần đủ tin tưởng vào ít nhất hai hệ thống chứng minh khác nhau, đảm bảo rằng chúng đều an toàn đủ, và đảm bảo nếu chúng gặp vấn đề, thì các vấn đề này phải khác nhau và không liên quan (do đó chúng sẽ không xảy ra vấn đề cùng lúc). Thứ hai, chúng ta cần tin tưởng rất cao vào logic cơ bản của hệ thống chứng minh kết hợp. Phần mã này phải ít hơn nhiều. Có một số cách để làm cho nó rất nhỏ, chỉ cần lưu trữ tiền trong một hợp đồng an toàn nhiều chữ ký (Safe multisig) được biểu thị bởi các hệ thống chứng minh khác nhau, nhưng điều này sẽ tăng chi phí Gas on-chain. Chúng ta cần tìm thấy một sự cân bằng nào đó giữa hiệu suất và an toàn.
Làm thế nào để tương tác với các phần khác của lộ trình?
Chuyển hoạt động sang L2 có thể giảm áp lực MEV trên L1.
Cải thiện tương tác L2
Chúng tôi đang giải quyết vấn đề gì?
Một trong những thách thức chính mà hệ sinh thái L2 đang đối mặt là người dùng khó điều hướng trong đó. Ngoài ra, phương pháp đơn giản nhất thường lại giới thiệu lại giả định về sự tin cậy: tương tác chuỗi chéo tập trung, khách hàng RPC, v.v. Chúng ta cần khiến việc sử dụng hệ sinh thái L2 cảm giác như đang sử dụng một hệ sinh thái ETH gồm các chuỗi con thống nhất.
Nó là gì? Làm thế nào nó hoạt động?
Cải tiến tương tác L2 có nhiều loại. Lí thuyết, Ethereum tập trung vào Rollup và thực hiện Phân mảnh L1 là một điều. Hệ sinh thái L2 hiện tại của Ethereum vẫn còn những hạn chế so với trạng thái lý tưởng trong thực tế:
1、Địa chỉ của chuỗi cụ thể:Địa chỉ cần chứa thông tin chuỗi (L1、Optimism、Arbitrum……). Khi điều này được thực hiện, quy trình gửi qua L2 có thể được thực hiện bằng cách đơn giản đặt Địa chỉ vào trường “Gửi”, tại thời điểm này Ví tiền có thể tự xử lý cách gửi (bao gồm sử dụng giao thức Tương tác chuỗi chéo).
2、Yêu cầu thanh toán trên chuỗi cụ thể: Phải có thể dễ dàng và chuẩn hóa tạo ra thông điệp dưới dạng “Gửi tôi X token loại Y trên chuỗi Z”. Điều này chủ yếu có hai tình huống ứng dụng: (i) Thanh toán giữa người và người hoặc giữa người và dịch vụ cửa hàng; (ii) 01928374656574839201 yêu cầu tài chính.
3、Tương tác chuỗi chéo兑换和 gas 支付:应有一个标准化的开放giao thức来表达Tương tác chuỗi chéo操作,如「我将向在 Arbitrum 上向我发送 0.9999 个以太币的人发送 1 个以太币(在 Optimism 上)」,以及「我将向在 Arbitrum 上包含此交易的人发送 0.0001 个以太币(在 Optimism 上)」。ERC-7683 是对前者的尝试,而 RIP-7755 是对后者的尝试,尽管这两者的应用范围都比这些特定用例更广。
4、khách hàng ánh sáng: Người dùng nên có khả năng xác minh thực tế chuỗi mà họ đang tương tác, chứ không chỉ đơn giản tin tưởng vào nhà cung cấp RPC. Helios của a16z crypto có thể làm được điều này (đối với Ether chính nó), nhưng chúng ta cần mở rộng tính không tin cậy này lên L2. ERC-3668 (CCIP-read) là một chiến lược để đạt được mục tiêu này.
Làm thế nào để cập nhật header chain Ethereum của khách hàng ánh sáng. Khi có header chain, bạn có thể sử dụng chứng minh Merkle để xác minh bất kỳ đối tượng trạng thái nào. Khi bạn có đối tượng trạng thái L1 đúng, bạn có thể sử dụng chứng minh Merkle (nếu bạn muốn kiểm tra trước xác nhận, bạn cũng có thể sử dụng chữ ký) để xác minh bất kỳ đối tượng trạng thái nào trên L2. Helios đã làm được điều này. Mở rộng đến sau là một thách thức về tiêu chuẩn.
Nguyên tắc hoạt động của Ví tiền Keystore
2、 Ý tưởng ‘Cầu nối Token chia sẻ’ táo bạo hơn: Hãy tưởng tượng một thế giới trong đó tất cả các L2 đều là Rollup bằng chứng hợp lệ và mỗi khe cắm đều gửi đến mạng Ethereum. Ngay cả trong thế giới như vậy, việc chuyển tài sản từ một L2 sang L2 khác vẫn đòi hỏi rút tiền và gửi tiền trong trạng thái nguyên bản, điều này cần phải trả một khoản phí Gas L1 lớn. Một cách giải quyết vấn đề này là tạo ra một Rollup chia sẻ đơn giản, chức năng duy nhất của nó là duy trì thông tin về việc mỗi loại Token thuộc về L2 nào và mỗi loại Token đó có số dư bao nhiêu, và cho phép cập nhật số dư này thông qua một loạt các giao dịch chuyển giao giữa các L2 được khởi xướng bởi bất kỳ L2 nào. Điều này sẽ giúp các giao dịch chuyển giao giữa các L2 không cần phải trả phí gas L1 mỗi lần chuyển giao và không cần sử dụng các công nghệ dựa trên nhà cung cấp thanh khoản như ERC-7683.
Có liên kết nào với nghiên cứu hiện có không?
Địa chỉ chuỗi cụ thể:
ERC-3770:
ERC-7683:
RIP-7755:
Scroll keystore Ví tiền设计式样:
Helios:
ERC-3668 (đôi khi được gọi là CCIP đọc):
Đề xuất ‘Xác nhận trước (chia sẻ)’ dựa trên Justin Drake:
L1S LOAD (RIP-7728): tải trước biên dịch/20388
REMOTESTATICCALL trong Optimism:
AggLayer, bao gồm cả ý tưởng của cầu đường chung cho token:
Còn gì cần phải làm? Có những sự cân nhắc nào?
Nhiều ví dụ trên phải đối mặt với một vấn đề nan giải về tiêu chuẩn khi nào nên tiêu chuẩn hóa và lớp nào cần tiêu chuẩn hóa. Nếu bạn chuẩn hóa quá sớm, bạn có thể cố thủ một giải pháp kém. Nếu bạn chuẩn hóa quá muộn, bạn có thể tạo ra sự phân mảnh không cần thiết. Trong một số trường hợp, có một giải pháp ngắn hạn với các thuộc tính yếu hơn dễ thực hiện hơn và một giải pháp dài hạn “cuối cùng đúng” nhưng mất nhiều năm để đạt được.
Những nhiệm vụ này không chỉ là vấn đề kỹ thuật, chúng cũng là vấn đề xã hội (thậm chí có thể là chính vấn đề xã hội), cần sự hợp tác của L2 vàVí tiền cũng như L1.
Làm thế nào để tương tác với các phần khác của lộ trình?
大多数这些提案都是「更高层」结构,因此对L1层面的考虑影响不大。一个例外是共享排序,它对giá trị có thể trích xuất tối đa(MEV)有着重大影响。
Mở rộng thực hiện trên L1
Chúng tôi đang giải quyết vấn đề gì?
Nếu L2 trở nên rất mở rộng và thành công, nhưng L1 vẫn chỉ có thể xử lý một lượng khối lượng rất nhỏ, thì Ethereum có thể đối mặt với nhiều rủi ro:
2、Nhiều nền tảng L2 được hưởng lợi từ việc kết nối chặt chẽ với hệ sinh thái tài chính phát triển mạnh mẽ trên L1, nếu hệ sinh thái này bị suy yếu nghiêm trọng, sự thúc đẩy để trở thành L2 (thay vì trở thành L1 độc lập) sẽ giảm đi.
3、L2 cần một khoảng thời gian rất dài để đạt được bảo đảm an ninh hoàn toàn giống như L1.
Vì những lý do này, việc mở rộng L1 và đảm bảo rằng nó có thể tiếp tục chứa đựng nhiều hơn và nhiều hơn các trường hợp sử dụng là rất có giá trị.
Nó là gì? Làm thế nào nó hoạt động?
Cách mở rộng đơn giản nhất là tăng giới hạn Gas trực tiếp. Tuy nhiên, điều này có thể làm cho L1 trở nên tập trung, do đó làm suy yếu một đặc tính quan trọng khác của ETHereum L1 mạnh mẽ: tính tin cậy của nó như một lớp cơ sở vững chắc. Vẫn còn tranh cãi về việc tăng giới hạn Gas đến mức nào là bền vững, và điều này cũng sẽ phụ thuộc vào việc triển khai những công nghệ khác nhau để làm cho việc xác minh Khối lớn hơn trở nên dễ dàng hơn (ví dụ, lịch sử hết hạn, không trạng thái, bằng chứng hợp lệ L1 EVM). Một điều quan trọng khác cần được cải thiện liên tục là hiệu suất của phần mềm khách hàng ETHereum, hiệu suất hiện tại cao hơn nhiều so với năm năm trước. Chiến lược tăng giới hạn Gas L1 hiệu quả sẽ liên quan đến việc tăng tốc sự phát triển của các công nghệ xác minh này.
Những cải tiến này sẽ được thảo luận kỹ hơn trong các bài viết Splurge sau này.
Cuối cùng, chiến lược thứ ba là Rollups bản gốc (hoặc rollups được khẳng định): Về bản chất, tạo ra nhiều bản sao EVM chạy song song, từ đó tạo ra một mô hình tương đương với Rollup có thể cung cấp, nhưng tích hợp nhiều hơn vào giao thức bản gốc.
Có liên kết nào với nghiên cứu hiện có không?
Còn cần làm gì, có những sự cân nhắc nào?
L1 mở rộng có ba chiến lược, có thể thực hiện độc lập hoặc song song:
Hiểu về những công nghệ khác nhau này, chúng ta sẽ thấy rằng mỗi công nghệ có những lợi ích và nhược điểm riêng. Ví dụ, Rollups nguyên bản có nhiều yếu điểm tương tự như Rollups thông thường trong việc kết hợp: bạn không thể gửi một giao dịch đơn lẻ để đồng bộ hóa các hoạt động trên nhiều Rollup, giống như bạn có thể làm trên một hợp đồng trên L1 (hoặc L2) cùng một lúc. Tăng giới hạn Gas sẽ làm suy yếu những lợi ích khác mà việc xác minh đơn giản trên L1 có thể đạt được, như tăng tỷ lệ người dùng kiểm tra nút và số lượng solo staker. Tùy thuộc vào cách triển khai, việc làm cho một số thao tác cụ thể trong EVM (Máy ảo Ethereum) rẻ hơn có thể làm tăng tính phức tạp của EVM.
Một câu hỏi quan trọng mà bất kỳ kế hoạch mở rộng L1 nào cũng cần trả lời là: Tầm nhìn cuối cùng của L1 và L2 là gì? Rõ ràng, việc đặt tất cả nội dung trên L1 là điều vô lý: các tình huống ứng dụng tiềm năng có thể liên quan đến hàng trăm nghìn giao dịch mỗi giây, điều này sẽ làm cho L1 không thể xác minh hoàn toàn (trừ khi chúng ta áp dụng Rollup nguyên bản). Nhưng chúng ta thực sự cần một số nguyên tắc hướng dẫn để đảm bảo chúng ta không rơi vào tình thế như vậy: Tăng giới hạn Gas lên 10 lần, gây thiệt hại nghiêm trọng cho phi tập trung của Ethereum L1.
Một quan điểm về phân công giữa L1 và L2
Làm thế nào để tương tác với các phần khác của lộ trình?
Đưa thêm người dùng vào L1 không chỉ có nghĩa là cải thiện khả năng mở rộng, mà còn có nghĩa là cải thiện các khía cạnh khác của L1. Điều này có nghĩa là nhiều hơn MEV sẽ được giữ lại trên L1 (thay vì chỉ là vấn đề của L2), do đó, nhu cầu xử lý MEV một cách rõ ràng sẽ trở nên cấp bách hơn. Điều này sẽ tăng đáng kể giá trị thời gian khe nhanh trên L1. Đồng thời, điều này cũng phụ thuộc lớn vào việc xác minh L1 (Verge) diễn ra thuận lợi.