
Cómo busca ChatGPT: un análisis interno
Cuando un usuario hace una pregunta a ChatGPT que requiere información actualizada o específica, se desencadena un proceso interno mucho más complejo que una simple consulta a un buscador. Gracias al análisis de los datos JSON que el modelo intercambia con sus servidores, podemos desvelar la metodología, la estrategia y la “inteligencia” que hay detrás de cada búsqueda. No es un acto único, sino una secuencia de decisiones, planificaciones y síntesis diseñadas para ofrecer la respuesta más útil y fiable posible.
A continuación, desglosamos este proceso paso a paso.
La decisión de buscar: el umbral de probabilidad
Antes de realizar cualquier búsqueda, el primer paso del sistema es decidir si realmente la necesita. Para ello, calcula una puntuación de probabilidad.
- El cálculo de probabilidad (search_prob): ChatGPT analiza la consulta del usuario y le asigna una puntuación de probabilidad de que sea necesaria una búsqueda en la web. Por ejemplo, a la pregunta “¿cuál es la mejor agencia seo en Madrid?”, el sistema le asignó una probabilidad del 60.1%.
- El umbral de búsqueda forzada (force_search_threshold): Existe un umbral predefinido, que en los casos analizados es de 0.65 (o 65%). Si la probabilidad de búsqueda calculada supera este umbral, el sistema se ve forzado a buscar sin más deliberación. Así ocurrió con varias consultar realizadas, que obtuvieron probabilidades entre el 66.7% y el 75.3%.
- Flexibilidad por debajo del umbral: Lo más interesante es que, incluso si la probabilidad no supera el 65%, como en el primer ejemplo, el sistema puede decidir buscar igualmente si considera que la calidad de la respuesta mejorará sustancialmente. Es una red de seguridad que le permite ser flexible y no depender únicamente de un umbral rígido.
La estrategia: múltiples consultas bilingües
Una vez que decide buscar, ChatGPT no se limita a usar la pregunta del usuario tal cual. En su lugar, diseña una estrategia de búsqueda cuanto menos, sorprendente:
- Múltiples búsquedas (queries): En lugar de una sola consulta, en todos los casos analizados siempre realiza un mínimo de dos. Esto le permite atacar el problema desde diferentes ángulos.
- Bilingüismo estratégico: Uno de los hallazgos más consistentes es que casi siempre una de las consultas se realiza en inglés, incluso cuando el prompt y la respuesta final son en español. Por ejemplo, para un prompt que preguntaba “cuál es la mejor agencia seo en Madrid”, las consultas fueron:
- “mejor agencia SEO Madrid” (Español)
- “top SEO agencies Madrid reviews” (Inglés)
- Esta táctica, aunque es útil al dar acceso a una base de conocimiento global mucho más amplia y con fuentes que tienen más autoridad y contenido, es contraintuitiva para idiomas que no son el inglés y crea una necesidad de tener contenido en inglés en las fuentes que aparecen estas búsquedas para ser relevante, aunque tu mercado sea el español.
Acotando el tiempo: el parámetro recency
Para asegurar que la información no esté desactualizada, especialmente en temas que cambian rápidamente, el sistema puede utilizar el parámetro recency.
- Función: Este parámetro acota los resultados de búsqueda a un período de tiempo específico. En los análisis, hemos visto usos como recency: 30 (últimos 30 días) o recency: 365 (último año).
- Ventaja: Esto es crucial para ofrecer recomendaciones relevantes, ya sea sobre los mejores hoteles de la temporada actual o sobre productos tecnológicos cuyas reseñas y precios cambian constantemente.
Un caso especial: la búsqueda de productos
Cuando el sistema detecta una intención de compra, como en “dame enlaces de maletas para comprar online”, activa una capacidad de búsqueda aún más avanzada y especializada.
- Consulta mixta (product_query y search_query): El asistente realiza dos tipos de búsqueda simultáneamente:
- Búsqueda de productos (product_query): Busca categorías de productos en bases de datos de comercio electrónico (ej. “maleta de cabina”, “maleta grande policarbonato”).
- Búsqueda de reseñas (search_query): Al mismo tiempo, busca reseñas de marcas o modelos específicos que sabe que son relevantes o de alta calidad (ej. “Samsonite S’Cure Spinner reviews”).
- Resultado estructurado: Este enfoque le permite presentar la información en un formato de “tienda online”, con fichas de producto que incluyen nombre, precio, vendedor, valoración y número de reseñas.
Fuentes de datos locales: más allá de Bing
Un detalle crucial revelado por los JSON analizados es que ChatGPT no solo se apoya en el índice general de la web para sus búsquedas locales, sino que integra información de proveedores de datos especializados.
Si bien las URLs que referencian a googleusercontent.com/maps sugieren un uso de los datos de Google Maps para ofrecer a los usuarios la opción de “cómo llegar al negocio local”, lo más interesante es la presencia explícita de Foursquare como fuente de información para los negocios. Esto lo vimos claramente en las entradas businesses del businesses_map al analizar las agencias SEO en Madrid, donde se indicaba el provider: “foursquare”.
Este descubrimiento sobre las fuentes de datos locales subraya una conclusión fundamental sobre la estrategia de búsqueda de ChatGPT: es un sistema híbrido y agnóstico de la fuente en la medida de lo posible.
Hallazgos Adicionales y Conclusiones
Más allá de cómo busca, lo más impresionante es lo que hace con la información encontrada. El análisis revela un profundo proceso de síntesis y enriquecimiento.
- El “Monólogo Interno” (thoughts): Antes de actuar, el asistente a menudo registra un “pensamiento” donde planifica su estrategia. Esto demuestra un proceso de razonamiento: interpreta la necesidad, descarta información irrelevante y diseña el formato de la respuesta final, a menudo decidiendo proactivamente añadir elementos útiles como un mapa.
- Síntesis, no Agregación: ChatGPT no se limita a volcar una lista de enlaces. Lee, entiende y sintetiza la información de múltiples fuentes (blogs, noticias, tiendas, foros) para construir una respuesta coherente.
- Enriquecimiento del Contenido: La respuesta final se enriquece con elementos de alto valor para el usuario:
- Tablas comparativas para facilitar decisiones rápidas.
- “Taglines” o resúmenes que capturan la esencia de cada opción (“Lujo y privacidad”, “Robustez premium”).
- Elementos visuales como mapas interactivos o carruseles de productos.
- Citas y Atribución (\ue200cite…): Cada dato clave está vinculado a su fuente original, ofreciendo una transparencia y fiabilidad que permite al usuario verificar la información por sí mismo.
En conclusión, el proceso de búsqueda de ChatGPT es una aproximación diferente a cómo tradicionalmente se ha buscado la información. Es un sistema que valora, planifica, ejecuta y sintetiza, realizando varias búsquedas para cada petición. Su capacidad para realizar búsquedas bilingües, acotadas en el tiempo, especializadas por tipo de contenido (productos, negocios locales o información) y, sobre todo, para transformar datos brutos en una guía práctica y verificable, es lo que realmente lo distingue de un simple motor de búsqueda. No está diseñado sólo para encontrar información, sino para entregar respuestas completas y útiles.
ARTÍCULOS RELACIONADOS
Somos una agencia de marketing digital especializada en SEO (posicionamiento en buscadores), gestión de reputación online (ORM), marketing de contenidos y Social Media.
Ayudamos a darle visibilidad a tu marca en internet para que consigas, no solo atraer a tus potenciales clientes, sino también fidelizarlos.