Profundicemos en la disponibilidad de datos en Filecoin.

星球日报
FIL9,03%
MP1,82%
PNG1,01%

深入探讨Filecoin上的数据可用性

Editor’s note: This article is reproduced from the original content published by Turan Vural Yuki Yuminaga of Fenbushi Capital on April 5, 2024. Fenbushi Capital was founded in 2015 and is a leading Asian blockchain asset management company with assets under management of 1.6 billion dollars. The company aims to play an important role in shaping the future of blockchain technology across various industries through research and investment. This article is an example of these efforts and represents the independent views of the authors, who have agreed to publish it here.

深入探讨Filecoin上的数据可用性

La disponibilidad de datos (DA) es una tecnología central de la escalabilidad de Ethereum que permite a los nodos verificar de manera eficiente si los datos están disponibles en la red sin necesidad de alojar los datos relacionados. Esto es crucial para construir eficientemente la escalabilidad vertical a través de rollos y otras formas, permitiendo que los nodos de ejecución aseguren que los datos de transacción estén disponibles durante el proceso de liquidación. También es crucial para la escalabilidad horizontal a través de fragmentación y otras formas (actualizaciones futuras planificadas para la red de Ethereum), ya que los nodos necesitan demostrar que los datos de transacción (o blob) almacenados en los fragmentos de la red están realmente disponibles en la red.

Recientemente se han discutido y lanzado varias soluciones de DA (por ejemplo, Celestia, EigenDA, Avail), todas con el objetivo de proporcionar una infraestructura de alto rendimiento y seguridad para el lanzamiento de aplicaciones de DA.

A diferencia de L1 como Ethereum, las soluciones de capa externa de DA tienen la ventaja de proporcionar un vehículo de bajo costo y alto rendimiento para los datos en la cadena. Las soluciones de DA suelen estar compuestas por sus propias cadenas públicas, las cuales se diseñan para lograr almacenamiento de bajo costo y sin permisos. Incluso después de la modificación, los datos alojados localmente en la cadena de bloques siguen siendo extremadamente ineficientes.

Dado esto, encontramos que explorar soluciones de optimización de almacenamiento (como FIL) como base de la capa DA es muy intuitivo. FIL utiliza su blockchain para coordinar transacciones de almacenamiento entre usuarios y proveedores de almacenamiento, pero permite que los datos se almacenen fuera de la cadena.

En este artículo, hemos investigado la viabilidad de construir una solución de DA sobre una red de almacenamiento descentralizada (DSN). Hemos considerado especialmente a Filecoin, ya que es el DSN más utilizado hasta la fecha. Hemos resumido las oportunidades que este tipo de solución traerá, así como los desafíos que se deben superar para construir esta solución.

DA Layer proporciona las siguientes funciones para los servicios que dependen de él.

1. Seguridad del usuario: Ningún nodo puede estar seguro de que los datos no disponibles estén disponibles.

2. Seguridad global: Excepto por unos pocos nodos, todos los nodos están de acuerdo en la disponibilidad / no disponibilidad de los datos.

3. Capacidad eficiente de búsqueda de datos.

Todos estos deben ser eficientemente completados para lograr la escalabilidad. La capa DA proporciona un rendimiento más alto a un costo más bajo en los tres aspectos mencionados anteriormente. Por ejemplo, cualquier nodo puede solicitar una copia completa de los datos para demostrar su custodia, pero esto es ineficiente. Al proporcionar un sistema que cumple con los tres aspectos mencionados anteriormente, hemos logrado una capa DA que proporciona la seguridad necesaria para la coordinación entre L2 y L1, y ofrece un límite inferior más fuerte incluso en presencia de una mayoría maliciosa.

Almacenamiento de datos

Los datos publicados en la solución DA tienen un ciclo de vida válido: un tiempo suficientemente largo para resolver disputas o verificar transiciones de estado. Los datos de transacciones solo necesitan tiempo suficiente para verificar las transiciones de estado correctas o dar a los validadores suficientes oportunidades para construir pruebas de fraude. Hasta la fecha de redacción de este artículo, Ethereum calldata es la solución más comúnmente utilizada para proyectos de disponibilidad de datos (rollups).

Verificación eficiente de datos

La muestra de disponibilidad de datos (DAS) es el método estándar para resolver el problema de DA. Tiene ventajas de seguridad adicionales y mejora la capacidad del actor de red para verificar la información de estado de sus pares. Sin embargo, depende de los nodos para realizar la muestra: deben responder a las solicitudes de DAS para asegurarse de que las transacciones de minería no sean rechazadas, pero las solicitudes de muestra de nodos no tienen incentivos positivos o negativos. Desde la perspectiva de los nodos que solicitan la muestra, no realizar DAS no será castigado negativamente. Por ejemplo, Celestia proporciona la primera y única implementación de cliente ligero que realiza DAS, lo que brinda a los usuarios suposiciones de seguridad más sólidas y reduce el costo de verificación de datos.

Acceso eficiente

DA necesita proporcionar un acceso eficiente a los datos para los proyectos que lo utilizan. Un DA lento puede convertirse en un cuello de botella para los servicios que dependen de él, lo que puede resultar en una baja eficiencia o incluso en errores del sistema.

Red de almacenamiento de descentralización

La red de almacenamiento descentralizado (DSN, como se describe en el libro blanco de Filecoin) es una red sin permisos compuesta por proveedores de almacenamiento que ofrece servicios de almacenamiento a los usuarios de la red. En términos informales, permite a los proveedores de almacenamiento independientes coordinar transacciones de almacenamiento con los usuarios que necesitan servicios de almacenamiento, y proporciona almacenamiento de datos de bajo costo y flexible para los usuarios que buscan servicios de almacenamiento asequibles. Esto se logra mediante la coordinación en una cadena de bloques que registra las transacciones de almacenamiento y admite la ejecución de contratos inteligentes.

Un esquema DSN es una tupla de tres protocolos: Put, Get y Manage. Esta tupla tiene atributos como garantías de tolerancia a errores e incentivos de participación.

Put(数据) → Clave

Para almacenar datos bajo una llave única, el cliente ejecuta ‘Put’. Esto se logra especificando el plazo de almacenamiento de los datos en la red, la cantidad de copias redundantes de los datos almacenados y el precio acordado con el proveedor de almacenamiento.

Get(Llave secreta) → datos

El cliente ejecuta Get para recuperar los datos almacenados bajo la llave secreta.

Administrar

Los participantes de la red llaman al protocolo de gestión para coordinar el espacio de almacenamiento y los servicios proporcionados por los proveedores, así como para corregir errores. Para Filecoin, esto se gestiona a través de la cadena de bloques. La cadena de bloques registra las transacciones de datos entre los usuarios y los proveedores de datos, así como la prueba de almacenamiento correcto de los datos, lo que garantiza el mantenimiento de las transacciones de datos. Se utiliza la prueba generada por los proveedores de datos en respuesta a los desafíos de la red para demostrar si los datos se almacenan correctamente. Cuando los proveedores de almacenamiento no generan pruebas de replicación o pruebas de espacio-tiempo de acuerdo con los requisitos del protocolo de gestión, se producen errores de almacenamiento, lo que lleva a una reducción en los derechos de los proveedores de almacenamiento. Si varios proveedores alojan copias de datos en la red, las transacciones pueden cumplirse a través de la búsqueda de nuevos proveedores de almacenamiento, lo que lleva a la autorreparación.

01928374656574839201

Oportunidad de DSN

Hasta ahora, el trabajo realizado por el proyecto DA ha sido transformar la cadena de bloques en una plataforma de almacenamiento en caliente. Dado que DSN ha optimizado el almacenamiento, en lugar de convertir la cadena de bloques en una plataforma de almacenamiento, podemos simplemente convertir la plataforma de almacenamiento en una plataforma que proporcione disponibilidad de datos. El colateral proporcionado por los proveedores de almacenamiento en forma de tokens FIL nativos puede proporcionar seguridad económica encriptada para garantizar el almacenamiento de datos. Por último, la programabilidad de las transacciones de almacenamiento puede proporcionar flexibilidad en los términos de disponibilidad de datos.

El motivo más importante para convertir la función DSN en una solución para el problema DA es reducir el costo de almacenamiento de datos en la solución DA. Como se describe a continuación, el costo de almacenamiento de datos en Filecoin es mucho más barato que en Ethereum. Teniendo en cuenta el precio actual de Ether en dólares, escribir 1 GB de calldata en Ethereum costaría más de 3 millones de dólares y se recortaría después de 21 días. Este costo de calldata podría representar más de la mitad del costo total de transacción basado en Ethereum. Sin embargo, el costo de almacenamiento de 1 GB en Filecoin es inferior a 0.0002 dólares al mes. A este precio, o cualquier precio similar, se garantiza que DA reducirá el costo de transacción para los usuarios y ayudará a mejorar el rendimiento y la escalabilidad de Web3.

Seguridad económica

En Filecoin, se requiere una garantía para proporcionar espacio de almacenamiento. Si el proveedor no cumple con la transacción o no cumple con las garantías de la red, la garantía se reducirá. Los proveedores de almacenamiento que no brinden el servicio enfrentarán el riesgo de perder la garantía y cualquier beneficio obtenido.

Ajuste del mecanismo de incentivos

Filecoin tiene muchas medidas de incentivo que son consistentes con el objetivo de DA. Filecoin proporciona medidas de represión contra comportamientos maliciosos o perezosos: durante el consenso, los proveedores de almacenamiento deben proporcionar pruebas de almacenamiento de forma activa en forma de pruebas de replicación y pruebas de espacio-tiempo, demostrando continuamente la existencia de almacenamiento sin suponer una mayoría honesta. Si los proveedores de almacenamiento no pueden proporcionar pruebas, se les reducirá la participación, se les eliminará del consenso y se les aplicarán otras sanciones. La solución actual de DA carece de incentivos para que los nodos ejecuten DAS y solo puede confiar en comportamientos temporales de altruismo para demostrar DA.

Programabilidad

La capacidad de comercio de datos personalizados también hace de DSN una plataforma atractiva para los DA. Las transacciones de datos pueden tener diferentes duraciones, lo que permite a los usuarios de DA basados en DSN pagar solo por los costos de DA que necesitan y ajustar la capacidad de tolerancia a fallos mediante la configuración del número de copias que se almacenarán en toda la red. La personalización adicional es respaldada por contratos inteligentes (Actors) en Filecoin, los cuales se ejecutan en FEVM. Esto también impulsa el crecimiento del ecosistema de aplicaciones descentralizadas (DApps) de Filecoin, desde soluciones de almacenamiento de cálculo prioritario como Bacalhau hasta soluciones de DeFi y liquidez como Glif. Retriev proporciona incentivos con permisos judiciales y ganchos de recuperación a través de Filecoin Actors. La programabilidad de Filecoin se puede utilizar para adaptar los requisitos de DA necesarios para diferentes soluciones, de modo que las plataformas que dependen de DA no tengan que pagar por más DA de lo que necesitan.

Desafíos enfrentados por la arquitectura DA basada en DSN

En nuestra investigación, hemos descubierto importantes desafíos que deben superarse antes de construir servicios de DA en DSN. Ahora estamos discutiendo la viabilidad e involucraremos a FIL en nuestra discusión.

Latencia de prueba

Filecoin necesita tiempo para demostrar la integridad de las pruebas de encriptación de transacciones y almacenamiento de datos. Cuando los datos se envían a la red, se dividen en sectores de 32 GB y se “empaquetan”. El empaquetado de datos es la base de la Prueba de Replicación (PoRep) y la Prueba de Espacio-Tiempo (PoST), la primera prueba que demuestra que el proveedor de almacenamiento ha almacenado una o más copias únicas de los datos, y la segunda prueba que demuestra que el proveedor de almacenamiento ha mantenido una copia única durante todo el período de transacción de almacenamiento. El costo computacional del empaquetado debe ser alto para asegurarse de que el proveedor de almacenamiento no pueda empaquetar datos a pedido y comprometer la PoRep necesaria. Cuando el protocolo solicita periódicamente al proveedor de almacenamiento que proporcione pruebas de almacenamiento únicas y continuas, el tiempo de seguridad necesario para el empaquetado debe ser mayor que la ventana de respuesta, de manera que el proveedor de almacenamiento no pueda falsificar temporalmente pruebas o copias. Por lo tanto, es posible que un proveedor necesite aproximadamente tres horas para empaquetar un sector de datos.

Umbral de almacenamiento

Debido al alto costo computacional de las operaciones de encapsulamiento, el tamaño de los sectores de encapsulamiento debe tener un valor económico. Para los proveedores de almacenamiento, el precio del almacenamiento debe demostrar que los costos de encapsulamiento son razonables, y a su vez, los costos de almacenamiento de datos resultantes deben ser lo suficientemente bajos (en este ejemplo, alrededor de 32 GB por bloque de datos) para que los usuarios estén dispuestos a almacenar datos en Filecoin. Si bien es posible encapsular sectores más pequeños, esto aumentaría el precio del almacenamiento para compensar a los proveedores de almacenamiento. Para abordar este problema, los agregadores de datos recopilan bloques de datos más pequeños de los usuarios y los presentan a Filecoin como un bloque de datos cercano a 32 GB. Los agregadores de datos comprometen los datos del usuario mediante Prueba de Inclusión de Datos del Sector (PoDSI) y el CID del sub-bloque (pCID), donde PoDSI garantiza que los datos del usuario estén incluidos en el sector y pCID se utiliza cuando el usuario recupera datos de la red.

Restricciones de consenso

Filecoin utiliza el mecanismo de consenso “Expected Consensus” (Consensus Esperado) con un tiempo de bloque de 30 segundos y un tiempo de confirmación final de varias horas, lo cual puede mejorar en un futuro próximo (consulte FIP-0086 para obtener más información sobre la rápida confirmación final en Filecoin). Esto suele ser demasiado lento para admitir el volumen de transacciones requerido por las soluciones de Capa 2 que dependen del procesamiento de datos de aplicaciones descentralizadas (DA). El tiempo de bloque en Filecoin está limitado por el hardware de los proveedores de almacenamiento. Cuanto más corto sea el tiempo de bloque, más difícil será para los proveedores de almacenamiento generar y proporcionar pruebas de almacenamiento, y más penalizaciones recibirán por no presentar las pruebas en el intervalo de tiempo correcto. Para superar este problema, se puede utilizar una subred de Consenso Interestelar (IPC) para acelerar el tiempo de consenso. IPC utiliza un consenso similar a Tendermint y la implementación de DRAND para introducir aleatoriedad: cuando DRAND se convierte en un cuello de botella, podremos lograr un tiempo de bloque de 3 segundos utilizando la subred de IPC; cuando Tendermint se convierte en un cuello de botella, se implementan PoC como Narwhal para alcanzar un tiempo de bloque de unos pocos cientos de milisegundos.

Velocidad de recuperación

El último obstáculo es la recuperación. A partir de las restricciones mencionadas anteriormente, podemos inferir que Filecoin es adecuado para el almacenamiento en frío o en caliente. Sin embargo, los datos de DA son calientes y requieren soporte para aplicaciones de alto rendimiento. En Filecoin, es difícil incentivar la recuperación; los datos deben desbloquearse antes de ser entregados al cliente, lo que aumenta la latencia. Actualmente, la recuperación rápida se logra mediante un acuerdo de nivel de servicio (SLA) o almacenando los datos no encapsulados junto con los sectores encapsulados, pero ninguno de estos métodos es confiable en la arquitectura de aplicaciones seguras y sin permisos en Filecoin. Específicamente, aunque la recuperación puede ser garantizada mediante FVM, la recuperación rápida con incentivos en Filecoin sigue siendo un área que necesita ser explorada más a fondo.

Análisis de costos

En esta sección, consideraremos los costos que estos factores de diseño conllevan. Mostramos los costos de almacenamiento de 32 GB como calldata de Ethereum, blobdata de Celestia, blobdata de EigenDA y sectores de Filecoin (utilizando precios de mercado cercanos a los actuales).

深入探讨Filecoin上的数据可用性

深入探讨Filecoin上的数据可用性

El análisis destaca el precio de calldata de Ethereum: el precio de 32 GB de datos es de 100 millones de dólares. Este precio muestra el costo de seguridad detrás del consenso de Ethereum y está sujeto a la fluctuación de Ethereum y el precio del Gas. La actualización de Dencun introduce Proto-Danksharding (EIP-4844), que introduce transacciones de Blob con el objetivo de tener 3 Blobs por bloque, cada uno con un tamaño de aproximadamente 125 KB, y también introduce precios variables de Gas Blob para mantener el objetivo de cantidad de Blobs por bloque. Esta actualización reduce el costo de Ethereum DA en un 1/5: es decir, los datos de Blob de 32 GB cuestan 20 millones de dólares.

Celestia y EigenDA han experimentado mejoras significativas: los datos de 32 GB ahora cuestan $8,000 y $26,000 respectivamente. Ambos están sujetos a la fluctuación de los precios del mercado y reflejan en cierta medida el costo de seguridad de los datos de consenso: Celestia utiliza su token nativo TIA, mientras que EigenDA utiliza Ether.

En todos los casos anteriores, los datos almacenados no son permanentes. El tiempo de almacenamiento de calldata de Ethereum es de 3 semanas, el tiempo de almacenamiento de blob es de 18 días y el período predeterminado de almacenamiento de blob de EigenDA es de 14 días. En la implementación actual de Celestia, los nodos de archivo almacenan datos de blob de forma indefinida, pero los nodos de luz solo pueden muestrear hasta 30 días.

Las últimas dos tablas son una comparación directa entre Filecoin y la solución actual de DA. Primero se lista el costo equivalente para un solo byte de datos en una plataforma dada, y luego se muestra la cantidad de bytes de Filecoin que se pueden almacenar en el mismo costo durante el mismo período de tiempo.

Esto indica que Filecoin es varias órdenes de magnitud más barato que las soluciones actuales de DA, ya que almacenar la misma cantidad de datos en el mismo período de tiempo solo cuesta una fracción de un centavo. A diferencia de los nodos de Ethereum y otras soluciones de DA, los nodos de Filecoin están optimizados para ofrecer servicios de almacenamiento. Su sistema de prueba permite a los nodos demostrar que están almacenando datos en lugar de copiarlos entre cada nodo de la red. Si no se considera el beneficio económico para los proveedores de almacenamiento, como el costo energético de encapsular los datos, los costos básicos del proceso de almacenamiento en Filecoin pueden considerarse insignificantes. En comparación con Ethereum, esto sugiere que existe una oportunidad de mercado de millones de dólares por GB para sistemas que ofrecen servicios de DA seguros y de alto rendimiento en Filecoin.

Throughput

A continuación, consideraremos la capacidad de la solución DA y las necesidades principales generadas por los rollups de Capa 2.

深入探讨Filecoin上的数据可用性

Debido a que la cadena de bloques de Filecoin se organiza en forma de tipsets, cada altura de bloque tiene múltiples bloques, por lo que la cantidad de transacciones que se pueden realizar no está limitada por el consenso o el tamaño del bloque. La restricción estricta de datos en Filecoin es su capacidad de almacenamiento a nivel de red, no la capacidad permitida por el consenso.

Para las necesidades diarias de DA, obtenemos datos de Rollups DA y ution proporcionados por Terry Chung y Wei Dai, que incluyen promedios diarios en un período de 30 días y datos de días de muestra individuales. De esta manera, podemos considerar la demanda promedio sin ignorar los desvíos del promedio (por ejemplo, la demanda de Optimism el 15 de agosto de 2023 fue de aproximadamente 261,000,000 bytes, más de cuatro veces el promedio de 64,000,000 bytes en los últimos 30 días).

Como se puede ver en esta elección, si bien los costos de DA tienen la oportunidad de soltar, los requisitos de DA deberán aumentarse significativamente para utilizar de manera efectiva el tamaño de sector de 32 GB de FIL. Si bien encapsular un sector de 32 GB con menos de 32 GB de datos es un desperdicio de recursos, podemos hacerlo sin dejar de obtener una ventaja de costos.

Arquitectura

En esta sección, consideraremos la arquitectura técnica que podemos construir hoy. Consideraremos esta arquitectura en el contexto de una aplicación L2 y la cadena L1 que sirve a L2 de manera independiente. Dado que esta solución es una solución DA externa, al igual que Celestia y EigenDA, no consideraremos a Filecoin como un ejemplo de L1.

深入探讨Filecoin上的数据可用性

Componente

Incluso en un nivel alto, los DA en FIL aprovechan el anhelo de muchas características diferentes del ecosistema FIL.

Transacción: Los usuarios de aguas abajo realizan transacciones en plataformas que requieren DA, lo cual puede ser L2.

Plataformas que utilizan DA: Estas plataformas utilizan DA como servicio, lo cual puede ser la publicación de datos de transacciones en Filecoin DA L2, o compromisos en L1 (como Ethereum).

Capa 1: Esta es cualquier L1 que incluye compromisos de datos hacia soluciones de almacenamiento distribuido (DA). Esto podría ser Ethereum, que admite L2 utilizando soluciones de almacenamiento distribuido de Filecoin.

Aggregator: El front-end de la solución de DA basada en Filecoin es un agregador, que es un componente centralizado que recibe datos de transacciones de L2 y otros usuarios de DA y los agrupa en sectores de 32 GB adecuados para su encapsulación. Aunque la validación de concepto simple incluirá un agregador centralizado, las plataformas que utilizan la solución de DA también pueden ejecutar sus propios agregadores. Por ejemplo, como un dispositivo auxiliar del clasificador L2, la centralización del agregador es similar a la descentralización del clasificador L2 o del dispersor EigenDA. Una vez que el agregador haya compilado una carga útil cercana a los 32 GB, llegará a un acuerdo de almacenamiento con los proveedores de almacenamiento para almacenar los datos. Se garantiza a los usuarios que sus datos estarán incluidos en el sector en forma de PoDSI (Prueba de Segmento de Datos Incluido) y que se utilizará el pCID para identificar sus datos una vez que se hayan introducido en la red. Este pCID se incluirá en el compromiso de estado en L1 para hacer referencia a los datos que respaldan las transacciones.

Validadores: Los validadores solicitan datos al proveedor de almacenamiento para garantizar la integridad de los compromisos de estado y establecer pruebas de fraude. En caso de que exista evidencia de fraude, estas pruebas serán presentadas a L1.

Almacenamiento de transacciones: Una vez que el agregador compile una carga útil de aproximadamente 32 GB, el agregador realizará una transacción de almacenamiento con el proveedor de almacenamiento para almacenar los datos.

Publicar blob (Put): Para iniciar un Put, el cliente DA enviará un blob que contiene los datos de la transacción al agregador. Esto se puede hacer fuera de la cadena (off-chain) o en la cadena (on-chain) a través de un oráculo agregador en la cadena. Para confirmar la recepción del blob, el agregador devolverá a la parte del cliente el PoDSI, lo que demuestra que su blob está incluido en el sector agregado que se enviará a la subred, y también devolverá el pCID (identificador de contenido de fragmento). Una vez que el blob se haya proporcionado en Filecoin, el cliente y otras partes relevantes lo utilizarán para hacer referencia al blob.

Los intercambios de datos aparecerán en la cadena después de unos minutos de que se haya realizado la transacción. El principal obstáculo para la latencia es el tiempo de encapsulación, que puede llevar hasta tres horas. Esto significa que, aunque la transacción se haya completado y los usuarios puedan estar seguros de que los datos aparecerán en la red, no se puede garantizar que los datos sean consultables hasta que se complete el proceso de encapsulación. El cliente de Lotus tiene una función de recuperación rápida, donde se almacenan copias de los datos sin encapsular junto con las copias encapsuladas, y puede proporcionar servicios de forma inmediata una vez que los datos sin encapsular se transfieren al proveedor de almacenamiento, siempre y cuando la recuperación de la transacción no dependa de la prueba de que los datos encapsulados aparezcan en la red. Sin embargo, esta función es decidida por el proveedor de datos y no se ofrece como una garantía de encriptación como parte del protocolo. Para ofrecer garantía de recuperación rápida, se necesitaría cambiar el consenso y los mecanismos de penalización/incentivo para hacer cumplir esto.

Recuperar blob (Get): Es similar a la operación de inserción (put). Se requiere una transacción de recuperación y la transacción aparecerá en la cadena en unos minutos. El retraso en la recuperación dependerá de los términos de la transacción y si se almacena una copia de los datos sin encapsular para una recuperación rápida. En caso de una recuperación rápida, el retraso dependerá de las condiciones de la red. Si no hay una recuperación rápida, los datos deben desencapsularse antes de ser entregados al cliente, lo que lleva el mismo tiempo que el encapsulamiento, aproximadamente tres horas. Por lo tanto, si no se realiza ninguna optimización, nuestro tiempo de ida y vuelta máximo es de seis horas. Antes de que esto se convierta en un sistema DA o de prueba de fraude viable, se requieren mejoras significativas en el servicio de datos.

Prueba de DA: La prueba de DA se puede dividir en dos pasos: el primero es proporcionar PoDSI al enviar datos al agregador durante el proceso de transacción, y luego proporcionar un compromiso continuo a través de PoRep y PoST proporcionados por el mecanismo de consenso de Filecoin. Como se mencionó anteriormente, PoRep y PoST proporcionan garantías planificadas y demostrables para el almacenamiento y la persistencia de datos.

Esta solución utilizará ampliamente los puentes, ya que cualquier cliente dependiente de DA (ya sea que construya pruebas o no) necesita interactuar con Filecoin. Para las transiciones de estado publicadas en L1 que contienen pCID, los validadores pueden realizar una verificación preliminar para asegurarse de que no se haya enviado un pCID falso. Hay varias formas de hacer esto, por ejemplo, mediante un oráculo que publique datos de Filecoin en L1 o mediante validadores que verifiquen si existen transacciones de datos o sectores correspondientes al pCID. Del mismo modo, es posible que se necesiten puentes para verificar la validez o la prueba de fraude de las pruebas publicadas en L1, para asegurar su validez o detectar fraudes. Los puentes disponibles actualmente son Axelar y Celer.

Análisis de seguridad

La integridad de Filecoin se logra mediante la reducción de colateral. Puede haber una reducción de colateral en dos casos: errores de almacenamiento o errores de consenso. Los errores de almacenamiento se refieren a los proveedores de almacenamiento que no pueden proporcionar pruebas de almacenamiento de datos (PoRep o PoST), lo cual está relacionado con la falta de disponibilidad de datos en nuestro modelo. Los errores de consenso se refieren a comportamientos maliciosos en el consenso, que es el protocolo que gestiona el libro mayor de transacciones, mientras que FEVM es una abstracción del libro mayor de transacciones.

  • El error de sector se refiere a la sanción que se produce cuando no se emite una prueba de almacenamiento continua. Los proveedores de almacenamiento tienen un periodo de gracia de un día en el que no se les sancionará por errores de almacenamiento. Después de 42 días de que se produzca un error en un sector, el sector será terminado y los costos incurridos serán destruidos.

BR(t) = ProjectedRewardFraction(t) * SectorQualityAdjustedPower

  • Si un sector presenta errores durante 42 días o si el proveedor de almacenamiento termina intencionalmente la transacción, se producirá la terminación del sector. La tarifa de terminación equivale a la cantidad máxima que el sector ha obtenido antes de la terminación, con un límite de ingresos de 90 días. Las tarifas de transacción no pagadas serán reembolsadas al usuario. Los gastos incurridos serán destruidos.

max(SP(t), BR(StartEpoch, 20 d) + BR(StartEpoch, 1 d) * terminationRewardFactor * min(SectorAgeInDays, 140))

  • Al finalizar la transacción, se producirá una reducción del Actor del mercado de almacenamiento, lo cual es una reducción de la garantía proporcionada por el proveedor de almacenamiento después de la transacción.

Filecoin ofrece una seguridad completamente diferente a la de otras cadenas de bloques. Por lo general, la seguridad de los datos en una cadena de bloques se garantiza mediante el consenso, pero en el caso de Filecoin, el consenso solo garantiza la seguridad del libro mayor de transacciones, no la seguridad de los datos de referencia de las transacciones. Los datos almacenados en Filecoin solo son incentivados si tienen suficiente seguridad para motivar a los proveedores de almacenamiento a ofrecer sus servicios. Esto significa que los datos almacenados en Filecoin se aseguran mediante penalizaciones por errores y recompensas comerciales (como la reputación del usuario). En otras palabras, los errores de los datos en la cadena de bloques equivalen a violar el consenso, lo que puede comprometer la seguridad de la cadena de bloques o la validez de las transacciones. Filecoin tiene tolerancia a fallos en el almacenamiento de datos, por lo que solo utiliza el consenso para garantizar la seguridad de su libro mayor de transacciones y actividades relacionadas. Si los proveedores de almacenamiento no cumplen con sus transacciones de datos, se les impondrá una multa de hasta 90 días del valor de la recompensa de almacenamiento, y perderán la garantía que proporcionaron para respaldar la transacción.

Por lo tanto, el costo de un ataque de retención de datos iniciado por un proveedor de Filecoin es solo el costo de oportunidad de la transacción de recuperación. La recuperación de datos en Filecoin depende de las tarifas pagadas por los usuarios para incentivar a los proveedores de almacenamiento. Sin embargo, no responder a las solicitudes de recuperación de datos no tendrá un impacto negativo en los proveedores de almacenamiento. Para reducir el riesgo de que un proveedor de almacenamiento individual ignore o rechace transacciones de recuperación de datos, los datos en Filecoin pueden ser almacenados por múltiples proveedores de almacenamiento.

Debido a que la seguridad económica detrás de los datos de Filecoin es mucho menor que la de las soluciones basadas en blockchain, también se debe considerar la prevención de la manipulación de datos. La manipulación de datos está protegida por el sistema de prueba de Filecoin. Los datos se hacen referencia a través de CID, y es posible detectar de inmediato si los datos están dañados mediante el CID. Por lo tanto, los proveedores de datos no pueden proporcionar datos dañados, ya que es fácil verificar si los datos obtenidos coinciden con el CID solicitado. Los proveedores de datos no pueden almacenar datos dañados en la ubicación de datos no dañados. Una vez que se reciben los datos del usuario, el proveedor debe proporcionar una prueba de encapsulación correcta de los sectores de datos para iniciar la transacción de datos (seleccionar esta opción). Por lo tanto, no se pueden iniciar transacciones de almacenamiento con datos dañados. Durante el período de validez de la transacción de almacenamiento, se proporcionará una prueba de PoST para demostrar la capacidad de almacenamiento (tenga en cuenta que esto demuestra tanto la capacidad de almacenamiento de los sectores de datos encapsulados como la capacidad de almacenamiento desde el último PoST). Debido a que el PoST depende de los sectores de encapsulación generados al momento de la prueba, los sectores dañados pueden dar lugar a un PoST falso, lo que lleva a errores en los sectores. Por lo tanto, los proveedores de almacenamiento no pueden almacenar ni proporcionar datos dañados, no pueden ser recompensados por proporcionar servicios para datos no dañados y no pueden evitar ser penalizados por manipular los datos del usuario.

Puede aumentar la seguridad mediante el colateral que el proveedor de almacenamiento promete al actor del mercado de almacenamiento, y actualmente el colateral lo deciden el proveedor de almacenamiento y el usuario. Si asumimos que la cantidad de colateral es lo suficientemente alta (por ejemplo, igual al colateral de los validadores de Ether), suficiente para incentivar a los proveedores a no incumplir, entonces podemos considerar qué más se necesita para garantizar la seguridad (aunque esto sería muy ineficiente en términos de capital, ya que se requiere colateral para garantizar la seguridad de cada transacción de blob o sector de blob agregado). Ahora, los proveedores de datos pueden optar por hacer que los datos no estén disponibles durante un máximo de 41 días antes de que se cancele la transacción de almacenamiento en el actor del mercado de almacenamiento. Supongamos que el tiempo de transacción de datos es corto, podemos suponer que los datos no estarán disponibles hasta el último día de la transacción. Sin coordinación de actores malintencionados, este caso se puede mitigar mediante la replicación en varios proveedores de almacenamiento para que el servicio de datos pueda continuar.

Podemos considerar el costo para que un atacante revierta el consenso, ya sea aceptando pruebas falsas o modificando el historial del libro mayor al eliminar transacciones del libro de pedidos, sin penalizar a los proveedores de almacenamiento responsables. Sin embargo, es importante tener en cuenta que en caso de una violación de seguridad de este tipo, el atacante puede manipular el libro mayor de Filecoin a su antojo. Para llevar a cabo este tipo de ataque, el atacante necesita tener al menos la mayoría del poder en la red de Filecoin. El poder está relacionado con el almacenamiento proporcionado a la red y actualmente la cantidad de datos en la cadena de Filecoin es de 25 EiB (10¹⁶ bytes), por lo que el atacante malintencionado necesitaría al menos 12.5 EiB para crear su propia cadena y ganar la regla de elección de bifurcación. Se puede mitigar aún más esta situación mediante recortes relacionados con errores de consenso, cuyas penalizaciones incluyen perder todo el colateral y las recompensas de bloque, y suspender la participación en el consenso.

Fuera de tema: Bloquear ataques a otras soluciones de DA

Aunque los casos anteriores muestran las deficiencias de Filecoin en la protección de los datos contra ataques de retención, no es el único ejemplo.

  • Ethereum: En general, la única forma de garantizar una respuesta a las solicitudes de la red Ethereum es ejecutando un nodo completo. Por lo tanto, los nodos completos no necesitan cumplir con solicitudes de recuperación de datos que estén fuera del consenso. Estructuras como PeerDAS introducen un sistema de puntuación entre los nodos en respuesta a la recuperación de datos, donde los nodos con puntuaciones lo suficientemente bajas (esencialmente reputación DA) pueden ser aislados de la red.
  • Celestia :Comparado con la estructura de Filecoin, Celestia tiene una mayor seguridad por byte y puede resistir ataques de retención, pero la única forma de aprovechar esta seguridad es mediante la administración de un nodo completo. Las solicitudes dirigidas a la infraestructura de Celestia que no sean internas y operadas internamente serán revisadas y no estarán sujetas a sanciones.
  • EigenDA: Similar to Celestia, any service can run an EigenDA Operator node to ensure the retrieval of its own data. Therefore, any data retrieval request outside the protocol will be reviewed. Please note that EigenDA has a centralized and trusted distributor responsible for data encoding, KZG commitments, and data distribution, similar to our aggregator.

Seguridad de recuperación

La capacidad de búsqueda es necesaria para DA. Idealmente, las fuerzas del mercado incentivarán a los proveedores de almacenamiento económicamente racionales a aceptar transacciones de búsqueda y competir con otros proveedores para reducir los precios para los usuarios. Se supone que esto es suficiente para que los proveedores de datos ofrezcan servicios de búsqueda, pero dada la importancia de DA, también es razonable exigir una mayor seguridad.

Actualmente, la recuperación no puede ser garantizada por la seguridad económica mencionada anteriormente. Esto se debe a que es difícil confiar en una forma de minimizar la confianza desde el punto de vista de la encriptación para demostrar que el extremo del usuario no ha recibido los datos (en caso de que el extremo del usuario necesite refutar la afirmación del proveedor de almacenamiento de que ha enviado los datos). Para garantizar la seguridad de la recuperación a través de la seguridad económica de Filecoin, se necesita una garantía de recuperación local del protocolo. A través de cambios mínimos en el protocolo, esto significa que la recuperación debe estar asociada con errores de sector o terminación de transacciones. Retriev es una prueba conceptual que puede proporcionar garantías de recuperación al mediar disputas de recuperación de datos utilizando un “árbitro” de confianza.

Nota: Búsqueda de otras soluciones de DA

01928374656574839201

Como se mencionó anteriormente, Filecoin carece de un protocolo de recuperación local que sea necesario para prevenir el comportamiento egoísta de los proveedores de almacenamiento (o recuperación). En el caso de Ethereum y Celestia, la única forma de garantizar el acceso a los datos del protocolo es alojar un nodo completo por cuenta propia o confiar en el SLA del proveedor de infraestructura. Como proveedor de almacenamiento en Filecoin, garantizar la recuperación no es fácil. Un enfoque similar en Filecoin implica convertirse en un proveedor de almacenamiento (que requiere una gran inversión en infraestructura) y aceptar con éxito transacciones de almacenamiento iguales a las que publican los usuarios como proveedores de almacenamiento. En este caso, las personas pagan por su propio almacenamiento.

Análisis de latencia

Debido al diseño del sistema de prueba de Filecoin y la falta de incentivos de recuperación, Filecoin no está optimizado para un rendimiento de latencia bidireccional desde la publicación inicial de los datos hasta la recuperación inicial de los datos. La recuperación de alto rendimiento en Filecoin es un campo de investigación activo que está en constante cambio a medida que mejora la capacidad de los proveedores de almacenamiento y se introducen nuevas características en Filecoin. Definimos “round trip” como el tiempo desde la transacción de datos hasta el momento en que los datos se pueden descargar por primera vez después de ser enviados a Filecoin.

tiempo del bloque

En el consenso esperado de Filecoin, las transacciones de datos pueden completarse en un tiempo de bloque de 30 segundos. Una hora es el tiempo de confirmación típico en la cadena para datos sensibles (como transferencias de monedas).

Procesamiento de datos

El tiempo de procesamiento de datos varía según el proveedor de almacenamiento y la configuración. Con el hardware de almacenamiento estándar, el proceso de encapsulación lleva 3 horas. Los proveedores de almacenamiento suelen acortar este tiempo a través de configuraciones especiales del cliente, paralelización e inversiones en hardware más potente. Esta variación también afectará la duración de desbloqueo de sectores, pero las opciones de búsqueda rápida en el cliente de Filecoin (como Lotus) pueden evitar por completo esta situación. La configuración de búsqueda rápida almacena copias de datos no encapsulados junto con los datos encapsulados, lo que acelera significativamente el tiempo de búsqueda. En base a esto, podemos suponer que la demora máxima desde la aceptación de una transacción de datos hasta que los datos estén disponibles en la cadena es de 3 horas.

Conclusiones y direcciones futuras

Este artículo explora cómo construir DA utilizando la red DSN existente (es decir, Filecoin). Consideramos los requisitos clave de DA como infraestructura extendida de Ethereum. Consideramos la viabilidad de construir DA en la red DSN basada en Filecoin y exploramos las oportunidades que las soluciones en Filecoin pueden ofrecer al ecosistema de Ethereum, o cualquier oportunidad que se beneficie de una capa de DA rentable.

Filecoin prueba que DSN puede mejorar significativamente la eficiencia de almacenamiento de datos en sistemas descentralizados basados en blockchain. Según el precio actual del mercado, se pueden ahorrar 100 millones de dólares por cada 32 GB de datos escritos. Aunque la demanda de DA aún no es suficiente para llenar un sector de 32 GB, todavía hay ventajas de costos al sellar sectores vacíos. Aunque la latencia de almacenamiento y recuperación en Filecoin actualmente no es adecuada para necesidades de almacenamiento en caliente, las operaciones específicas de los proveedores de almacenamiento pueden ofrecer un rendimiento razonable y asegurar que los datos estén disponibles en un plazo de 3 horas.

Filecoin proveedor de almacenamiento confianza puede ser ajustado mediante colateral variable, por ejemplo, en EigenDA. Filecoin extiende esta seguridad ajustable permitiendo almacenar una gran cantidad de copias en la red, aumentando así su tolerancia a fallos bizantinos ajustables. Para evitar ataques de retención de datos, se necesita una solución garantizada y de alto rendimiento para la recuperación de datos. Sin embargo, al igual que con cualquier otra solución, el único método para garantizar la recuperabilidad es hospedar los nodos o confiar en proveedores de infraestructura.

Vemos oportunidades para DA en el desarrollo adicional de PoDSI, que puede reemplazar DAS (junto con las pruebas actuales de Filecoin) para garantizar que los datos estén incluidos en sectores de encapsulación más grandes. Según las circunstancias, esto podría hacer que el procesamiento de datos más lento sea tolerable, ya que las pruebas de fraude se pueden publicar en 1 día a 1 semana, mientras que DA puede garantizarse según sea necesario. PoDSI sigue siendo una tecnología nueva en desarrollo intensivo, por lo que aún no sabemos cómo funcionará un PoDSI eficiente ni qué mecanismos serán necesarios para construir sistemas en torno a él. Dado que ya existen soluciones para realizar cálculos en los datos de Filecoin, una solución para calcular PoDSI en datos encapsulados o no encapsulados puede no estar fuera de alcance.

Con el desarrollo de DA y el sector de Filecoin, nuevas combinaciones de soluciones y tecnologías de apoyo pueden traer nuevas validaciones conceptuales. Como se muestra en la integración de Solana con la red de Filecoin, DSN tiene el potencial de ser una tecnología de expansión. Los costos de almacenamiento de datos en Filecoin ofrecen una oportunidad abierta con un gran espacio de optimización. Aunque los desafíos discutidos en este artículo se plantean en el contexto de apoyo a DA, sus soluciones finales construirán una gran cantidad de nuevas herramientas y sistemas más allá de DA.

Los datos de los gráficos relacionados provienen de Filecoin spec, EIP-4844, EigenDA, Celestia implementation, Celenium, Starboard, file.app, Rollups DA y ution, así como del precio de mercado aproximado actual.

“Enlace original”

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios