Investigadores científicos de Amazon, UCLA y Meta proponen un marco de aprendizaje de integración de gráficos tolerante al ruido de extremo a extremo

Investigadores científicos de Amazon, UCLA y Meta proponen un marco de aprendizaje de integración de gráficos tolerante al ruido de extremo a extremo

Investigadores de Amazon, dos profesores de Ciencias de la Computación de la Universidad de California se asociaron con el científico jefe de Meta para realizar un estudio sobre el aprendizaje automático y presentaron, dentro de ese marco, un marco para el aprendizaje integrado tolerante al ruido de extremo a extremo: PGE Este último les permitió aprovechar tanto la información textual como la estructura gráfica de los gráficos de conocimiento del producto (PG) e importar integraciones para la detección de errores. Las pruebas realizadas demostraron la eficacia de PGE. El estudio titulado: Sólido gráfico de productos que incorpora aprendizaje para la detección de errores » fue publicado en Amazon Science.

Xian Li, Yifan Ethan Xu, investigadores de Amazon, Xin Luna Dong, científico jefe de Meta, Yizhou Sun y Kewei Cheng, profesores de UCLA son los autores de este estudio.

Cada vez más clientes potenciales recurren a sitios de comercio electrónico como Amazon, eBay, Cdiscount para sus compras, y la pandemia ha amplificado este enfoque. Estos sitios minoristas, por otro lado, están haciendo un mayor uso de los gráficos de conocimiento del producto (PG) para mejorar la búsqueda de productos y brindar recomendaciones.

Gráficos de conocimiento del producto

Un PG es un gráfico de conocimiento (KG) que describe los valores de los atributos del producto y se construye a partir de los datos del catálogo de productos. En un PG, cada producto está asociado con varios atributos, como la marca del producto, la categoría del producto y otra información relacionada con las propiedades del producto, como el sabor y el ingrediente. A diferencia del KG tradicional, donde la mayoría de los triples se presentan como (entidad principal, relación, entidad final), la mayoría de los triples en un PG tienen la forma de (producto, atributo, valor del atributo), donde el valor del atributo es un texto breve, por ejemplo: “Brand A Tortilla Chips Spicy Queso, 6 bolsas de 2 oz”, sabor, “Spicy Queso”. Los trillizos de atributos son un tipo de trillizos.

READ  Cómo la ciencia hace que nuestros viajes en avión sean más seguros y más seguros

Los minoristas proporcionan datos de productos e inevitablemente contienen muchos tipos de errores, incluidos contradictorios, erróneos o ambiguos. Cuando estos errores son ingeridos por un PG, conducen a un rendimiento deficiente. Dado que la validación manual en un PG es imposible debido a la gran cantidad de productos, se necesitaba un método de validación automático.

Los métodos de integración de gráficos de conocimiento (KGE) son relevantes en el aprendizaje de representaciones eficientes para datos de gráficos multirelacionales y han mostrado un rendimiento prometedor en la detección de errores (es decir, determinar si un triplete es correcto o no) en KG. Desafortunadamente, para los KG existentes, los métodos de integración no se pueden usar directamente para detectar errores en un PG debido a la rica información textual y al ruido.

Product Graph Embedding (PGE) desarrollado por el equipo

Por lo tanto, el equipo tuvo que responder a esta difícil pregunta de investigación: «¿Cómo generar incrustaciones para un gráfico de conocimiento rico en texto y propenso a errores para ayudar en la detección de errores?» «. Presenta el nuevo marco de aprendizaje integrado, » Incrustación de gráficos de productos » robusto, para aprender incrustaciones eficientes para dichos gráficos de conocimiento. Para este marco, los investigadores procedieron en dos pasos:

  • Las integraciones coincidieron perfectamente con los signos de la información textual de los tripletes de atributos y la información estructural en el gráfico de conocimiento. Los investigadores aplicaron un codificador CNN para aprender representaciones textuales de títulos de productos y valores de atributos, luego los incorporaron en la estructura de triplete para capturar los patrones subyacentes en el gráfico de conocimiento.
  • en segundo lugar, los investigadores incorporaron una función de pérdida sensible al ruido para evitar que los trillizos ruidosos en el PG distorsionaran las integraciones durante el entrenamiento.
READ  El Devónico "Supereye" de los trilobites

Para cada instancia positiva en los datos de entrenamiento, el marco predice la consistencia de un triple con los otros tripletes en el KG y subestima una instancia si, para una buena confianza, la corrección es baja. PGE es capaz de modelar evidencia textual y estructura gráfica y es resistente al ruido. Este modelo genérico y evolutivo no solo es aplicable en el campo de producto, sino que también destaca en otros campos como Freebase KG.

Fuentes del artículo: https://assets.amazon.science/51/23/25540bf446749098496f5d28e189/pge-robust-product-graph-embedding-learning-for-error-detection.pdf.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *