<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Miren Berasategi &#187; números</title>
	<atom:link href="http://www.mirenberasategi.com/tag/numeros/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.mirenberasategi.com</link>
	<description>Observando la comunicación en internet</description>
	<lastBuildDate>Sat, 04 Feb 2012 12:41:38 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Índice de niebla, una medida de legibilidad</title>
		<link>http://www.mirenberasategi.com/blog/analitica-web/indice-niebla-medida-legibilidad/</link>
		<comments>http://www.mirenberasategi.com/blog/analitica-web/indice-niebla-medida-legibilidad/#comments</comments>
		<pubDate>Thu, 04 Dec 2008 08:14:17 +0000</pubDate>
		<dc:creator>Miren</dc:creator>
				<category><![CDATA[Analítica web]]></category>
		<category><![CDATA[índice]]></category>
		<category><![CDATA[índice de niebla]]></category>
		<category><![CDATA[legibilidad]]></category>
		<category><![CDATA[números]]></category>
		<category><![CDATA[texto]]></category>
		<category><![CDATA[web]]></category>

		<guid isPermaLink="false">http://www.atapistudio.com/?p=202</guid>
		<description><![CDATA[Ayer descubrí gracias a José Manuel el índice de niebla, o índice de niebla de Gunning, una medida de la legibilidad de un [...]]]></description>
			<content:encoded><![CDATA[<p>Ayer <a href="http://titojose.wordpress.com/2008/11/04/como-calcular-el-indice-de-niebla-de-un-texto/">descubrí gracias a José Manuel</a> el índice de niebla, o <a href="http://en.wikipedia.org/wiki/Gunning-Fog_Index">índice de niebla de Gunning</a>, una medida de la legibilidad de un texto utilizada en lingüística. En origen está pensado para el inglés, pero puede ser una referencia muy útil para ver si los textos que escribimos pueden resultar demasiado complejos de entender. <span id="more-202"></span></p>
<p>El índice de niebla de Gunning se calcula mediante el siguiente algoritmo:</p>
<ul>
<li>Escoger un fragmeto de texto de alrededor de 100 palabras (sin omitir ninguna frase).</li>
<li>Calcular el promedio de la longitud de las frases (dividir el número de palabras totales por el número de frases en el fragmento).</li>
<li>Contar las palabras con tres o más sílabas (palabras complejas), sin incluir nombres propios o palabras compuestas.</li>
<li>Sumar el promedio de longitud de las frases y el porcentaje de palabras complejas (+13,37%, no simplemente +0,1337)</li>
<li>Multiplicar el resultado por 0,4</li>
</ul>
<p>La fórmula sería la siguiente:</p>
<p>[math]0,4*\left( \left(\frac{\mbox{palabras}}{\mbox{frases}}\right) + 100\left(\frac{\mbox{palabras complejas}}{\mbox{palabras}}\right) \right )[/math]</p>
<p>Por lo que cuentan en <a href="http://deakialli.blogspot.com/2005/03/midiendo-la-facilidad-de-lectura.html">Deakialli Docu Mental</a>, <a href="http://www.infonomia.com">Infonomía</a> (en un contenido sólo para suscriptores, una pena) recoge que la puntuación ideal es entre 7 y 8; que a partir de 12 resulta muy complicado de leer; y que para los sitios web se establece un ideal de entre 11 y 15. Esto último parece contradecir la idea generalizada de que los textos deberían simplificarse para la web, en lugar de hacerse más complejos.</p>
<p>Se puede <a href="http://www.answers.com/topic/gunning-fog-index-1">consultar el índice de niebla para algunas publicaciones anglosajonas</a> o utilizar un <a href="http://simbon.madpage.com/Fog/">contador automático que haga el cálculo</a> para nuestros textos, aunque lo cierto es que el índice tiene sus límites. El más evidente es que no tiene en cuenta factores de presentación del texto (longitud de línea, número de líneas, tamaño del texto, contraste con el fondo&#8230;), sino sólo el contenido. Y obviamente es muy posible que sea menos fiable en idiomas que no sean inglés&#8230;</p>
<p>Aún así, es interesante conocer la existencia de éste y <a href="http://en.wikipedia.org/wiki/Readability">otros índices para medir la legibilidad</a> de los textos, y de <a href="http://www.readability.info/">herramientas que lo hacen automáticamente</a> por nosotros.</p>
<p>El índice de niebla de Gunning para este post es de alrededor de 17, así que en teoría es muy complejo de leer incluso para los estándares establecidos para la web. ¿Realmente os parece tan complejo? Estaría bien analizar otros textos sobre los que nos hagamos una idea de comlpejidad y calcular su índice, para ver si efectivamente puede usarse para otros idiomas o es un índice de uso exclusivo para el inglés. ¿Cómo son vuestros textos de complejos?</p>
]]></content:encoded>
			<wfw:commentRss>http://www.mirenberasategi.com/blog/analitica-web/indice-niebla-medida-legibilidad/feed/</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>Cálculos estadísticos y analítica web</title>
		<link>http://www.mirenberasategi.com/blog/analitica-web/estadistica-analitica-web/</link>
		<comments>http://www.mirenberasategi.com/blog/analitica-web/estadistica-analitica-web/#comments</comments>
		<pubDate>Tue, 02 Dec 2008 07:58:19 +0000</pubDate>
		<dc:creator>Miren</dc:creator>
				<category><![CDATA[Analítica web]]></category>
		<category><![CDATA[coeficiente de variación]]></category>
		<category><![CDATA[desviación estándar]]></category>
		<category><![CDATA[estadística]]></category>
		<category><![CDATA[números]]></category>
		<category><![CDATA[web]]></category>

		<guid isPermaLink="false">http://www.atapistudio.com/?p=189</guid>
		<description><![CDATA[Desde que empecé con la analítica web me ha resultado evidente, quizá porque los dos aprendizajes coincidieron en el tiempo, la importancia que [...]]]></description>
			<content:encoded><![CDATA[<p>Desde que empecé con la analítica web me ha resultado evidente, quizá porque los dos aprendizajes coincidieron en el tiempo, la <strong>importancia que la estadística podía tener para profundizar más allá de lo que las aplicaciones de analítica decidan darte</strong>. Los números nunca han sido lo mío, pero lo cierto es que dar sentido a todos estos datos acerca del uso de la web que pueden obtenerse en Google Analytics es algo que me resulta un reto tremendamente motivador (desde mis limitadísimos conocimientos).</p>
<p>Hoy ha sido uno de esos días en los que he sido testigo del <strong>fascinante resultado de la fusión del análisis estadístico con la analítica web</strong> (que no deja de ser, por su parte, análisis estadístico). <span id="more-189"></span></p>
<p>La pregunta es si una serie de sitios y el servidor que los aloja necesitan o no la aplicación de <a href="http://spanish.akamai.com/">Akamai</a>. Las personas que gestionan el servidor nos pedían unos datos para hacer esa valoración: la <strong>media de páginas vistas diarias</strong> y <strong>si los sitios en cuestión tienen o no un &#8220;riesgo alto de subidas de tráfico inesperadas&#8221;</strong>.</p>
<p>La media de páginas vistas diarias no ha resultado difícil (como la propia pregunta indica, promedio de las páginas vistas de todos los días del periodo), pero me he empeñado en dar una <strong>respuesta argumentada y respaldada con datos</strong> a la segunda pregunta, en lugar de un &#8220;sí, bueno, en realidad este sitio sí que suele tener subidas, y éste otro también algunas, de vez en cuando&#8230;&#8221;. Y es cuando me he acordado de mi curso de estadística en la UOC, y de <strong>algo que se llamaba <a href="http://es.wikipedia.org/wiki/Desviaci%C3%B3n_est%C3%A1ndar">desviación estándar</a></strong>, que es la media de distancias que tienen los datos respecto del promedio. Cuanto mayor sea ese valor, más se desvían las páginas vistas de cada día del promedio, o dicho de otra forma, más picos (y/o valles) tienen los datos.</p>
<p>Pero los sitios que estaba analizando tenían un volumen de tráfico muy diferente, así que un valor muy alto en la desviación estándar de un sitio con mucho tráfico no necesariamente quiere decir que ese sitio tenga más picos que otro con menor desviación estándar pero también con menos tráfico. En definitiva, <strong>no podía comparar los sitios según su desviación estándar, necesitaba relativizar ese dato</strong>. Así que, como mis compañeros de trabajo han empezado a mirarme como si hablara en chino, me he puesto en contacto con mi amigo el <a href="http://www.jjgibaja.net">matemático y experto analista de datos</a>  para consultarle cómo hacer que las desviaciones estándar fuesen comparables. Al mismo tiempo, una extraña intuición me ha llevado a <strong>relativizar las desviaciones estándar con los promedios de cada sitio</strong>, es decir, <code>(desviación estándar)/promedio</code>, lo cual me ha devuelto cifras ciertamente comparables y que daban la sensación de ser algo parecido a lo que buscaba&#8230; pero soy de letras, así que nunca me fío de mi intuición con los números.</p>
<p>Cuál ha sido mi sorpresa cuando <a href="http://www.jjgibaja.net">Juanjo</a> me ha confirmado (eskerrik asko!) que lo que necesito para relativizar y comparar las diferentes desviaciones estándar es precisamente <code>(desviación estándar)/promedio</code>, y que esa medida se llama <strong>coeficiente de variación</strong>. Eureka!</p>
<p>En definitiva, he podido responder <strong>qué sitios tienen relativamente mayores picos</strong> (mediante el coeficiente de variación), y también <strong>qué sitios generan picos con mayor volumen de tráfico</strong> en términos absolutos (mediante la desviación estándar). ¡Tiene su encanto, esto de los números!</p>
]]></content:encoded>
			<wfw:commentRss>http://www.mirenberasategi.com/blog/analitica-web/estadistica-analitica-web/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

