Tests de Contenido

December 20, 2014

En los últimos años, ha estado en auge la optimización para motores de búsqueda, conocida como SEO (Search Engine Optimizacion), una estrategia cuyos resultados no dependen de nosotros y en la que competimos contra el resto del mundo. La misión más lícita de los motores de búsqueda es mostrar los mejores resultados primero. Para ello, basan sus sistemas en requisitos verbales que después implementan mediante múltiples indicadores1. Si nuestro sitio web responde bien a esos requisitos, el motor de búsqueda “se compromete” a mostrarlo más cerca de la primera posición en los resultados de búsqueda. Personalmente, recomiendo seguir tales pautas de calidad, independientemente del resultado obtenido en la indexación de nuestra web por los motores de búsqueda. Pero, ¡hay tanta optimización posible al margen del SEO!

La optimización del contenido para la consecución de nuestros objetivos sí depende de nosotros. P.ej. convertir más visitas en ventas o aumentar el porcentaje de visitantes que se registran en nuestra web. Y este es el objetivo de los tests de contenido.

La dictadura de los datos

A menudo basamos el diseño y las funciones de nuestra web en baremos arbitrarios, fundados en nuestros propios gustos o en suposiciones preconcebidas, pero las suposiciones tienden a ser erróneas, como puede demostrar un sencillo test A/B de contenido. En los tests A/B existen dos versiones del mismo contenido, y se presenta cada uno a una mitad de la audiencia2. Al final del experimento, la versión que se ha comportado mejor en función de los criterios establecidos, prevalece. Creo que el siguiente ejemplo es muy ilustrativo.

En noviembre de 2007 un directivo de Google se unió a la campaña del candidato a la presidencia de EE.UU. Barack Obama, como publicista digital. Su objetivo era maximizar el número de subscripciones en la web de la campaña para posteriormente solicitar donaciones dinerarias con los emails recopilados; para ello, usó los tests A/B. La versión inicial tenía en su página de portada una luminosa foto de Obama en turquesa y un botón rojo que decía “Regístrese”. Se probaron varios verbos alternativos para el botón: “Sepa más”, “Únase”, y “Comience”. La versión del botón que decía “Sepa más” consiguió un 18.6% más de registros. Similarmente, una foto en blanco y negro superó en un 13.1% adicional a la original. El incremento compuesto total alcanzó el 40%. Después, el equipo de Obama pensó que un vídeo podía superar a la foto en blanco y negro, pero el vídeo empeoró hasta en un 30.3% respecto a la imagen original en turquesa. Lo más chocante para el equipo de Obama fue cuan equivocados estaban sus instintos. Al final de la campaña, se estimó que 4 de los 13 millones de emails recopilados –traducidos en $75 millones– se debían a los cuidadosos experimentos A/B.

En un test A/B, se desvía una parte del tráfico a la versión de control A, y otra parte a la versión de testeo B, para comprobar cual rinde mejor.
En un test A/B, se desvía una parte del tráfico a la versión de control A, y otra parte a la versión de testeo B, para comprobar cual rinde mejor.

Una ventaja colateral al uso de los tests de contenido es que eliminan la inconveniencia de mantener reuniones cuyo único fin es elegir el color de un botón o el texto para un encabezado: sencillamente se puede probar todas las versiones y que los datos decidan la version ganadora.

Diseño de alternativas

Como ya expliqué en Estrategias de Innovación, para innovar hay que introducir pequeños cambios y después analizarlos, evaluarlos y decidir cómo enfocar la siguiente iteración del ciclo. Varios estudios demuestran la correlación entre la posición del puntero y el enfoque de la vista del usuario; por eso, hay compañías que miden todo: movimiento del ratón, tiempo en cada página, clicks, lugar donde abandonan, etc.

Para dar algunas pautas sencillas, consideremos un conjunto de elementos comunes que se pueden variar para realizar los experimentos de contenido:

  • Botones de llamada a la acción: del estilo “Haga click aquí”, “Leer ḿas”, “Comprar”, “Descargar”, “Hable con un experto”, etc. El verbo y los colores utilizados pueden producir un cambio significativo.
  • Disposición de la página: influye en la capacidad de asimilación por parte de los visitantes, e incluye el orden y la estructura en que aparece el contenido.
  • Controles de navegación: es importante facilitar al visitante la orientación y la navegación, e.d. guiar y mostrar claramente dónde está y a dónde puede ir.
  • Texto: puede rehacer el cuerpo del mensaje a transmitir y probar diferentes encabezados. También puede influir el tamaño y color, así como las fuentes de texto empleadas.
  • Ofertas promocionales: las palabras que elija pueden tener un impacto dramático en las promociones.
  • Proceso de pago: solo porque un artículo se añada al carrito, no significa que el negocio esté asegurado, muchas conversiones se pierden por el camino. Es importante aportar seguridad y confianza en cada pantalla del proceso de pago.
  • Imágenes: el ejemplo de la foto de Obama ilustra claramente el efecto que las imágenes pueden tener. Otro ejemplo: un vendedor de camisetas online evaluó un incremento del 30% en las ventas al mostrar las camisetas sobre modelos humanos reales.
  • Proceso de selección de productos: esto incluye mostrar claramente cuándo un producto se añade al carrito. También puede influir cómo se muestra el detalle de un artículo: en una nueva página o en una ventana modal emergente.
  • Campos confidenciales: datos personales y de tarjetas de crédito; se puede añadir información contextual y garantías.
  • Testimonios: casos de éxito de su producto/servicio en diferente ubicación y formato.
  • Validación social: estadísticas o extractos de participación social.

Heurística de diseño

Hay que definir cuidadosamente las variables que se quiere incrementar u optimizar, de forma que los resultados sean medibles. Además, puede ocurrir que experimentos diferentes tengan resultados interdependientes. P.ej. supongamos que tratamos de aumentar las ventas de un producto realizando una campaña de marketing via email con dos versiones de mensaje, A y B, que incluyen un enlace a la página del producto: podemos medir el número de personas que acceden a la página del producto o el número de las que finalizan una compra.

La paradoja está en que una versión puede aumentar el número de visitas a la página del producto pero al mismo tiempo ser la que menos ventas consigue finalizar. Es fácil poner un ejemplo que cause este comportamiento: solo imagine que el email dice que el producto es gratis: mucha gente seguirá el enlace pero, al ver que es engañoso, la mayoría abandonaría antes de finalizar la compra. Yo creo que lo más apropiado es comenzar eligiendo las variables que representan los indicadores más importantes y continuar con otros indicadores secundarios de los subprocesos.

De forma similar a cómo ocurre con la elección de los objetivos, la segmentación también puede conducir a conclusiones desorientadoras. P.ej. con la segmentación basada en el género, un experimento puede mejorar el resultado general para una población de hombres y mujeres, pero ocultar un empeoramiento para uno de los géneros –que se vería compensado por un aumento mayor en magnitud para el otro género. Si se desea medir poblaciones segmentadas, es importante que la muestra sea representativa en cada uno de los segmentos para evitar resultados sesgados o imprecisos.

Conclusiones

De nuevo, como dije en Estrategias de Innovación, hay un umbral que separa el incrementalismo y el cambio radical que altera el rumbo de una empresa: 10000 pequeños retoques experimentales en una web no van a proporcionar un cambio de dirección cuando sea necesario. Merece la pena recordar las palabras de genios rompedores, como Henry Ford: “No es tarea de los consumidores decidir lo que quieren”. Por tanto, se trata de encontrar un equilibrio, normalmente testeando las cosas pequeñas, el detalle.

En los primeros tiempos, los tests de contenido solo estaban al alcance de unas pocas grandes empresas, pues el modelo estadístico detrás de los tests es complejo. Pero hoy en día, y gracias a herramientas gratuitas como Piwik, una de las plataformas de análisis web de código abierto más populares, o la conocida Google Analytics con sus multi-armed bandits3, los experimentos de contenido están al alcance de todos. Así que si se está preguntando qué testear, yo contestaría todo y tanto como pueda.


  1. P.ej. Panda, el último algoritmo de indexación de Google, lista varias cuestiones para proporcionar una guía con la que entender su concepto de sitio web de alta calidad

  2. Existen otras versiones optimizadas del test en que cada vez se muestra más la versión con mejor rendimiento. 

  3. Multi-armed bandits es una alternativa a los tests A/B que puede contrastar simultáneamente múltiples alternativas y que adapta dinámicamente la proporción del tráfico dirigida a cada versión para optimizar las métricas establecidas. 

Archivos