R



R es un entorno y lenguaje de programación con un enfoque al análisis estadístico.
R es una implementación de software libre del lenguajes pero con soporte de alcance estático. Se trata de uno de los lenguajes más utilizados en investigación por la comunidad estadística, siendo además muy popular en el campo de la minería de datos, la investigación biomédica, la bioinformática y las matemáticas financieras. A esto contribuye la posibilidad de cargar diferentes bibliotecas o paquetes con funcionalidades de cálculo o gratificación.



R es parte del sistema GNU y se distribuye bajo la licencia GNU GPL. Está disponible para los sistemas operativos Windows,Macintosh, Unix y GNU/Linux.




EMPECEMOS CON LAS VENTAJAS:

R ES UN SOFTWARE LIBRE:


*  Cuenta con la licencia GNU GPL el cual consta de 4 libertades

*    Libertad 0: la libertad de ejecutar el programa como desee y con cualquier propósito

* Libertad 1: libertad de estudiar el funcionamiento del programa y adaptarlo a sus necesidades.

*    Libertad 2: La libertad de rescribir copias para ayudar a los demás.

* Libertad 3: La libertad de manejar el programa y publicar las mejorar, de manera que toda comunidad se beneficie.

*  Muchos de los software comerciales estadísticos cuestan cientos de dólares. Como SigmPlot cuesta cerca de 900 dólares, Minitab más de 1500 dólares, MatLab 2150 dólares, entre otros.

Es multiplataforma:

 R funciona en Mac, Windows, y en números sistemas UNIX. Esto significa que cualquier persona puede trabajar con tus datos, figuras, análisis y más importante aún usar tus instrucciones para generar las figuras y el análisis. Asi que cualquier persona, y en cualquier lugar del mundo, con acceso a cualquier SO puede usar R sin ninguna licencia.

Es de código abierto:

 existe una gran comunidad de voluntarios trabajando para mejorarlo, lo cual permite ser moldeado y dirigido a cuestiones específicas. Creando así programas y paquetes que funcionen en el entorno R. Programas tales como R-studio, Java GUI for R, R- commander, RKWard, entre otros, y con más de 6000 paquetes indexado en CRAN, Biocoductor, GitHub y R-Forge.


Actualización:

 Esta comunidad de usuarios hace que se actualice constantemente, la última versión 3.2.2 "Fire Safety", es reciente del 14 de agosto del 2015.


 R es una plataforma estadística, lo cual ofrece todas las técnicas de análisis de datos. Además de programar nuevos métodos y rutinas estadísticas de una manera fácil y robusta.
Los gráficos:

 disponibles en R son de gran calidad y de una versatilidad impresionante.

R remplaza la combinación de varios programas para el proceso de análisis de datos, por ejemplo Excel, Minitab, SAS, SigmaPlot, entre otros. Esto no solo resulta en el alto costo de las licencias de múltiples programas, si no también, en la gran cantidad de archivos con diferentes formatos que no podrían leer otros programas estadísticos. En cambio con solo utilizar R, puedes realizar todo el análisis de datos e inclusive leer archivos de diferentes formatos.

R se está convirtiendo en un estándar en la sociedad científica, por hacer figuras de calidad de publicación, además de poder exportarse a diferentes formatos incluidos PDFs.



AHORA LAS DESVENTAJAS

R tiene una vasta documentación de ayuda, descripción de paquetes y de funciones, que es difícil encontrar información específica en un momento dado.

Los mensajes de error que R nos muestra, no es específica sobre los fallos que estamos realizando y solo un usuario con cierta experiencia en el uso de R puede saberlo. 

R es un lenguaje de programación en línea de comando, lo cual no involucra el uso de menús como otros programas estadísticos, esto hace que muchas personas que no están familiarizadas en la programación, les resulte muy difícil migrar a R. Pero esto más que una desventaja es una ventaja, porque al programar entenderás mejor la base de la estadística y el análisis de datos, comparados con otras personas que no utilizan R. 

Así como lo dijo Steve Jobs en una conferencia, 
“Cada persona en este país debería saber cómo programar una computadora… porque eso te enseña a pensar”



CARACTERÍSTICAS

R proporciona un amplio abanico de herramientas estadísticas y gráficas.
Al igual que S, se trata de un lenguaje de programación, lo que permite que los usuarios lo extiendan definiendo sus propias funciones.

 De hecho, gran parte de las funciones de R están escritas en el mismo R, aunque para algoritmos computacionalmente exigentes es posible desarrollar bibliotecas en CC++ o Fortran que se cargan dinámicamente. 

Los usuarios más avanzados pueden también manipular los objetos de R directamente desde código desarrollado en C. R también puede extenderse a través de paquetes desarrollados por su comunidad de usuarios.

R hereda de S su orientación a objetos. La tarea de extender R se ve facilitada por su permisiva política de lexical scoping.
Además, R puede integrarse con distintas bases de datos y existen bibliotecas que facilitan su utilización desde lenguajes de programación interpretados como Perl y Python.

Otra de las características de R es su capacidad gráfica, que permite generar gráficos con alta calidad. R posee su propio formato para la documentación basado en LaTeX.

R también puede usarse como herramienta de cálculo numérico, campo en el que puede ser tan eficaz como otras herramientas específicas tales como GNU Octave y su equivalente comercial, MATLAB. 

 Se ha desarrollado una interfaz, RWek  para interactuar con Weka que permite leer y escribir ficheros en el formato arff y enriquecer R con los algoritmos de minería de datos de dicha plataforma.





*  Versión 0.16: Es la última versión alfa desarrollada esencialmente por Ihaka y Gentleman, que incluye gran parte de las características descritas en el "White Book".

*  La lista de correo comenzó su andadura el 1 de abril de 1997.

*  Versión 0.49 (23 de abril de 1997): Es la versión más antigua de la que se conserva el código (que todavía compila en algunas plataformas UNIX). En esta fecha arrancó también CRAN con tres espejos que albergaban 12 paquetes. Poco después aparecieron las versiones alfa para Windows y Mac OS.

*    Versión 0.60 (5 de diciembre de 1997): R se integra oficialmente en el Proyecto GNU. El código se versiona a través de CVS.

R efectuando múltiples tareas en Windows, versión 3.2.2.

* Versión 1.0.0 (29 de febrero de 2000): Los desarrolladores lo consideran suficientemente estable para su uso en producción.

*  Versión 1.4.0: Se introducen los métodos S4 y aparece la primera versión para Mac OS X.

* Versión 2.0.0 (4 de octubre de 2004): Introduce el lazy loading, que permite una carga rápida de datos con un coste de memoria mínimo.

* Versión 2.1.0: Aparece el soporte para UTF-8 y comienzan los esfuerzos de internacionalización para distintos idiomas.

*       Versión 2.9.0: El paquete 'Matrix' se incluye en la distribución básica de R.  

*      Versión 2.11.0 (22 de abril de 2010): Soporte para sistemas Windows de 64 bits.

* Versión 2.13.0 (14 de abril de 2011): Añadida una nueva función al compilador que permite acelerar las funciones convirtiéndolas a byte-code.

* Versión 2.14.0 (31 de octubre de 2011): Añadidos espacios de nombres obligatorios para los paquetes. Añadido un nuevo paquete de paralelización.

* Versión 2.15.0 (30 de marzo de 2012): Nuevas funciones de balanceo de cargas. Mejorada la velocidad de serialización para grandes vectores.

* Versión 3.0.0 (3 de abril de 2013): Mejoras en GUI, funciones gráficas, gestión de memoria, rendimiento e internacionalización.

ESPECIFICACIONES
R es un lenguaje y entorno de programación para análisis estadístico y gráfico. Su historia ya fue contada en genbetadev y no quiero ser repetitivo pero para hacer un resumen, podríamos decir que es un dialecto libre del lenguaje S, desarrollado por Robert Gentleman y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en 1993.







No hay comentarios:

Publicar un comentario