jueves, 16 de abril de 2015

El Partido de las probabilidades

La revista new scientist de marzo de 2015 presenta un debate respecto a si nuestra realidad depende del azar o si todo esta estrictamente conectado por una fuerza superior que mueve toda la realidad a su conveniencia, Imaginemos entonces que son dos equipos de futbol.

Tomas de Aquino, era el más diplomático ya que digamos no jugaba para  ninguno de los dos equipos al postular que para que el universo pudiera existir debería, haber cierto grado de libre albedrío entre  los humanos; al mismo tiempo los humanos están por fuera de las esferas divinas en las que se producen eventos fuera del control  humano (azar).

Newton fue el primero en meter  un gol a favor de lo predecible al refutar con su ley que los cuerpos  del universo y los planetas no giran al azar si no que existe una fuerza que los hace mover en X o Y dirección llamada gravedad.

Con la aparición de la teoría del famoso efecto mariposa  se empato el partido. El aleteo de un mariposa en Colombia puede crear un tornado en Texas. De acuerdo a esta teoría, que lo que llamamos azar no es más que falta de información acerca de los eventos que pasan más allá de nuestra visión.

Hoy en día, la física cuántica se ha convertido en  lo más cercano que se tiene sobre lo que podría considerarse una explicación de la realidad y es en esta disciplina donde se ve que también hay científicos que juegan en equipos rivales:

La revista opina que hasta ahora el equipo que juega a favor del azar en la física cuántica ha ganado todos los partidos. Dale a un átomo de luz la posibilidad  de pasar a través de un espejo; puede que pase o puede que se refleje. Espera que una partícula radioactiva emita un atomo, puedes esperar un milisegundo o un siglo.

Anotando goles en el equipo rival existen casos como la ecuación de Schrödinger que determina a través de probabilidades como será la posición de un electrón a través del tiempo. Pero esto no es seguro; la física cuántica dice  que si quisiéramos, podríamos traspasar una pared, eso implica que todos y cada uno de los átomos  del cuerpo estén en una posición tal que puedan pasar por los espacios vacios de los átomos de la pared. La probabilidad de que eso ocurra es ridículamente baja.


Este debate entre azar y las predicciones exactas aun sigue siendo uno de los grandes misterios de la humanidad ya que no se sabe a ciencia cierta si con la suficiente información es posible saber cual va  a ser el futuro con exactitud o si simplemente el futuro es imposible de predecir  porque hay muchos factores que son ajenos a la naturaleza humana.El interrogante de quien gana esta partido aun sigue remanente para muchos 


jueves, 19 de marzo de 2015

(Elefante+ Ratón)/2=Vaca (una cuestión de promedios)

Esta es una cuestión muy curiosa pero interesante que sacan a relucir en el libro  Probably Not: Future Prediction Using Probability and Statistical Inference y es la siguiente :

"Puedes saber que el promedio entre un ratón y un elefante es una vaca,pero estudiar la vaca no te va ayudar a saber mas ni sobre elefantes ni sobre los ratones"

Es una cuestión bien interesante y la moraleja de la historia  es que cuando hay medidas que difieren mucho la una de la otra (desviación estándar alta), entonces sabemos que el promedio no nos es muy util.

Fin 




viernes, 6 de marzo de 2015

La estadística detrás de Duolingo (aproximación)

Duolingo se ha convertido  en una de las paginas mas populares para aprender idiomas y en parte su éxito lo debe a la buena capacidad que tiene el programa  para detectar lo que  personas que no hablan el idioma intentan decir  y calificarlo como bueno malo o regular.

Para poder lograr lo anterior el programa Duolingo debe saber procesar los datos de personas que no son hablantes nativos del idioma que están aprendiendo.Entonces por ejemplo para el ingles Duolingo no debe procesar la voz de la persona cuando habla al igual que hablara un nativo si no que debe diseñar un programa que permita reconocer cuando quien le habla es una persona proveniente de China o de Colombia la cual tendría un acento bastante diferente.

Esta habilidad para reconocer el acento de personas no nativas es también necesaria para los software de traducción los cuales deben identificar la palabra a pesar de que este en un acento diferente. Es también necesaria cuando hay ruidos externos como un ventilador o trafico.

Desde el punto de vista estadístico cuando una persona  intenta hablar un idioma diferente a su idioma nativo debe considerarse como una desviación al estándar, pues lo que diga se alejara de la media que seria la pronunciación perfecta.

Cunado un software debe lidiar con desviación estándar producida por una persona que no es un hablante nativo debe utilizar primero el método del modelo oculto de markov para identificar y reconocer la voz y posteriormente debe hacer una clasificación por el  método  del K-nearest neighborg (el vecino mas cercano).


Paso 1. El modelo oculto de Markov.

Este método es una extensión de las cadenas de Markov pero a diferencia de las cadenas de Markov no busca la aplicación de eventos dependientes sino independientes y es el mas usado para el reconocimiento de voz.El reconocimiento de voz es un evento independiente porque lo que se diga al principio no afecta a lo que se diga después.

Paso 2. La clasificiacion por le K-nearest Neighbor.

Cuando el programa de reconocimiento de voz usa el método de clasificación del K-nearest neighbor debe hacer la comparación de lo que se le dijo al sistema en contraste con una base de datos .Normalmente una base de datos  de este tipo,esta compuesta por 100 personas que pronunciaron la palabra en cuestión. Dentro de ese grupo de personas deben encontrarse individuos de diferentes grupos de acentos extranjeros ademas de la pronunciación hecha por expertos.







viernes, 27 de febrero de 2015

Como discriminar con los precios???

Al escuchar la palabra discriminar nos vienen a la mente no precisamente ideas muy agradables; sin embargo, la "discriminación de precios" o llamemoslo mejor  segmentación de precios, puede resultar en un trato de doble ganancia en el  que no solo beneficia a la empresa si no también al cliente .

Un caso no muy conocido de empresas que fallaron en el intento de realizar una discriminación de precios es el de  Coca Cola.En algún momento el jefe ejecutivo de la compañía anuncio una campaña con maquinas dispensadoras con  sensores de temperaturas y que cobrarían mas cara la bebida entre mas calor hubiera.La indignación de los clientes de Coca Cola no se hizo esperar y la empresa no tuvo de otra mas que retractarse de la idea.

Mucha gente conoce el oscuro caso de Amazon , la compañía  intento cargar precios  individualizados a sus clientes "sin que estos  lo supieran" lo que termino causando indignación y daño en la imagen de la compañía. A mi parecer las fallas de Amazon pueden resumirse en los siguientes dos asteriscos:


*Subestimar al cliente a no anunciar las diferencias de precio: El cliente de hoy en día es un cliente mas que informado  y super inteligente, no se le puede hacer cargos de diferentes precios y esperar que estos no se den cuenta,este  fué el error de Amazon.

*No tener razones de peso para justificar las diferencias de precio: La estrategia  cargaba un precio mas bajo si era primera ves que se logeaba en la web de Amazon,esto en doble sentido causó daño pues se creaban cuentas innecesarias para obtener descuentos y los viejos clientes de la compañía se sintieron menospreciados por no poder acceder a los beneficios que si tenían los nuevos clientes.




¿CUAL HUBIERA SIDO UNA MEJOR ESTRATEGIA PARA DISCRIMINAR PRECIOS?

Como empresa siempre se debe pensar primero en el cliente sin dejar de lado que se debe buscar las ganancias que permitan la supervivencia de la empresa claro esta.

Es por ello que la mejor estrategia  es siempre que haya una TRATO JUSTO entre cliente y empresa

Primero que todo anunciar que se van a dar estas preferencias de precio  es de mucha ayuda para evitar  malos entendidos con los clientes

Dar razones de peso para los cambios de precio ,si el libro sale antes estoy seguro que hasta el doble pagarían algunos,si de pronto se compra algo en cierto horario... son estrategias mas justas y que son beneficiosas tanto para el cliente como para le empresa.

sábado, 14 de febrero de 2015

La habilidad que todo el mundo debería aprender

En una época en la que el manejo de datos  y donde el data mining y la era del Big Data ya esta a la vuelta de la esquina,uno se pregunta  ¿cual sera esa habilidad, que será la panacea para todos los problemas ,que le servirá a uno para ser empleable al mismo tiempo que sera útil si uno quiere entrar en la corriente del emprendimiento?

Resulta que es muy difícil llamar esa habilidad, un lenguaje de programación especifico, antes se creía que R era lo ultimo en guaracha para el manejo de datos y entonces aparece Python...antes se creía que Haddop era el indicado para almacenar Big data y ya hoy hasta Amazon ofrece esos servicios....¿entonces en un mundo tan cambiante que es lo que realmente deberíamos aprender?


Lo crean o no la respuesta realmente existe, se trata de adquirir la habilidad de SOLUCIONAR PROBLEMAS .Si , así como suena, la habilidad de solucionar problemas puede ser la solución a todos sus problemas.


Pero donde se prende esta habilidad????

Pues me temo que aunque halla  libros de solución de problemas, nada es mejor que convertirse en un necio, si en un necio .No se trata de aprender los lenguajes,los programas o las técnicas mas sofisticadas,por que lo que hoy es lo mejor mañana ya quedara obsoleto.


Como ser un necio????

Es muy sencillo, se trata de no ser una esponja....las esponjas solo absorben y no producen nada,ser necio se trata de utilizar la herramienta que mas fácil se te haga de utilizar...no importa si no es la herramienta de moda.

Se trata de HACER ,ponte todos los días un problema bien pequeño que sepas que puedes solucionar en una hora o dos . Busca bases de datos publicas y trata de encontrar patrones en esas bases de datos.
Que tal si de ser necio,sale el autor  la proxima gran aplicacion ??? o si de ser necio poco a poco terminas convirtiéndote en un guru solucionador de problemas???

Este articulo es inspirado en el articulo "The Only Skill you Should be Concerned With" http://www.datasciencecentral.com/profiles/blogs/the-only-skill-you-should-be-concerned-with


ryanlerch-thinkingboy-outline in clipart open library

viernes, 6 de febrero de 2015

Mediciones 100% exactas solo existen en cuentos de hadas

Había una vez el  rey  de la  fabrica de ladrillos y que quería  saber cual es el nivel de resistencia de estos ladrillos.

Si lo que se quisiera es obtener una medición 100% exacta de cual es la resistencia de estos ladrillos,entonces la solución seria probar uno y cada uno de los ladrillos producidos en la fabrica  ¿resultaría rentable esto ?

Es por ello que se hace necesario la toma de muestras al alzar a la hora de realizar una medición.

Uno de los problemas que pueden presentarse con la toma de muestras  es que estas lleguen  a ser muy pequeñas,pero personalmente no creo que sea un problema.No es problema siempre y cuando la muestra represente al  menos  parte de lo que vamos a medir.Como decimos en el titulo: las mediciones nunca, nunca son 100% exactas.


Algo mas que se debe tener en cuenta al tomar una muestra, es que en ocaciones puede ocurrir lo que se conoce como error de sesgo ,en donde a pesar de escoger una muestra que es aparentemente aleatoria,por cuestiones del azar la muestra puede estar inclinada hacia cierto valor.


La moraleja  del cuento, es que las mediciones 100% exactas solo existen en cuentos de hadas y que  una muestra vale mas que mil mediciones grandes pero al mismo tiempo debemos tener mucho cuidado de que este muestra realmente corresponda a un conjunto aleatorio y que sea significativa en  comparación al total de elementos que vamos a medir.

Fin

Image by Amilo Clip Art




Imagen by fabiovaleggia in clipart

miércoles, 4 de febrero de 2015

Es el email Marketing una estrategia valida en estos días ????

Reflexionando acerca de como en el mundo del marketing y los negocios ,lo que hoy fue la  herramienta ideal quizás mañana ya hoy no lo sea.

Con la aparición del e-mail las campañas de marketing basadas en estos medios apuntaban a ser una mina de oro y en realidad lo fueron,ya que realmente permitían generar una segmentación de clientes efectiva y un costo bastante bajo...la pregunta que queda en el aire es si aun son lo suficientemente efectivas.

Estamos en una época en la que con tan solo un clic la gente puede eliminar cualquier clase de  Spam o "correo basura"  y la gente cada día es mas precavida y alarmada con los correos que recibe, debido a la proliferación de estos correos basura.De acuerdo al Message Anti-Abuse Working Group  la proliferación de este tipo de mensajes alcanzó oscilaba en el 2010 entre el 80 y 90% del total de correos en la red.

Entonces seguirá siendo efectivo el marketing por correo electronico? para mi personalmente , la empresa debe dejar de ser quien envié los correos ;es el mismo cliente es quien debe estar interesado en recibir este tipo de información.

Los newsfeed  o las suscripcciones en las que es el mismo usuario o cliente quien pide recibir la información corresponden a alternativas mas viables en las circunstancias de estos días.