Total de conceptos: 98
Garantizar que todas las personas, independientemente de sus capacidades o contextos, puedan interactuar con datos y herramientas de análisis. Implica crear interfaces inclusivas, formatos comprensibles y datos abiertos.
Un algoritmo puede entenderse como un conjunto de instrucciones o una especie de receta para llevar a cabo un proceso. Cuando se aplica a los computadores, un algoritmo le dice a un computador cómo llevar a cabo una determinada tarea. Así, cada vez que le des la orden de hacer algo, el ordenador sabrá qué pasos debe seguir.
Es el lugar donde se guardan los datos en bruto antes de ser procesados en formatos más manejables.
Técnica que utiliza datos históricos, algoritmos y modelos estadísticos para prever eventos futuros o tendencias. Ayuda en la toma de decisiones anticipadas.
Proceso de recopilación, medición y análisis de datos sobre el comportamiento de los usuarios en un sitio web. Ayuda a optimizar experiencias, identificar tendencias y tomar decisiones estratégicas.
El aprendizaje automático es un tipo de inteligencia artificial por el que las máquinas o algoritmos informáticos que "aprenden" a mejorar a través de la experiencia.
Subárea de la inteligencia artificial (IA) y el aprendizaje automático (Machine Learning) que utiliza redes neuronales artificiales inspiradas en la estructura del cerebro humano para procesar grandes cantidades de datos y resolver problemas complejos. Es ampliamente utilizado en diversas aplicaciones debido a su capacidad para aprender representaciones jerárquicas de datos.
Técnica de aprendizaje automático donde un modelo se entrena con datos etiquetados para realizar predicciones o clasificaciones. Por ejemplo, identificar correos como "spam" o "no spam" a partir de ejemplos previos clasificados.
Organización y estructuración lógica de contenidos y datos para facilitar su acceso y comprensión. Se aplica en diseño web, aplicaciones y sistemas complejos, logrando que menús claros y categorías bien definidas mejoren la experiencia del usuario.
Proceso de utilizar herramientas y tecnologías para recopilar, procesar y analizar datos sin intervención manual. Mejora la eficiencia y reduce errores. Por ejemplo, actualizar un informe de ventas diario con datos extraídos de una base de datos o sistema de gestión.
Algunos datos no estructurados, como documentos completos, textos o vídeos, suelen almacenarse en bases de datos NoSQL. Se trata de bases de datos diseñadas teniendo en cuenta diferentes tipos de datos. Una base de datos NoSQL es no relacional, lo que significa que almacena datos que no pueden mostrarse en forma de tabla.
El big data es un campo que trabaja en soluciones para recoger, transportar y almacenar cantidades muy grandes de datos.
Los datos de alta calidad son precisos, completos, coherentes y válidos. Cuanto mejor sea su calidad, mayor será la probabilidad de obtener información de valor a partir de ellos.
Capacidad de un sistema o diseño para adaptarse rápidamente a las necesidades del usuario, como el ajuste automático al tamaño de la pantalla.
Un catálogo de datos es una herramienta de gestión de metadatos que las empresas utilizan para inventariar y organizar los datos de sus sistemas. Los beneficios típicos incluyen mejoras en el descubrimiento de datos, la gobernanza y el acceso a la información.
Interfaz conversacional que emplea lenguaje natural para automatizar tareas, responder preguntas o explorar datos complejos.
Conjunto de prácticas y tecnologías para proteger sistemas, redes y datos contra ataques o accesos no autorizados.
Puede describirse como el estudio de los datos. Los científicos de datos llevan a cabo experimentos e investigaciones, comprometidos con la resolución de problemas y la búsqueda de respuestas. Juntan diferentes datos, diseccionan patrones, buscan anomalías, generan tablas y gráficos, exploran el aprendizaje automático y la inteligencia artificial. Si la minería de datos consiste en extraer valor, la ciencia de los datos consiste en generar valor.
Plataforma de código abierto para gestionar y publicar datos abiertos de manera eficiente. Facilita la organización, el acceso y la visualización de conjuntos de datos, promoviendo la transparencia y el uso compartido.
Un CMS es un software que sirve para gestionar el contenido de un sitio web.
Tecnología que permite acceder a almacenamiento, procesamiento y aplicaciones a través de internet sin depender de infraestructura local.
Son colecciones de datos con un tema compartido. Frecuentemente, las personas buscan conjuntos de datos para sus investigaciones. Son prácticos pues al analizarlos en conjunto permiten tener el contexto completo de un problema.
Cuando se utiliza en relación con las bases de datos, la palabra "consulta" tiene un significado muy similar al de "búsqueda". Si alguien realiza una consulta en una base de datos, quiere decir que ha buscado un dato o conjunto de datos específico.
Un símbolo o área marcada y delimitada en un mapa que muestra la distribución de alguna propiedad.
CSV se refiere al formato "Valores Separados por Comas", por sus siglas en inglés. Un archivo CSV, como su nombre indica, divide los datos con comas. Esto hace que sea fácil exportarlos a tablas como hojas de cálculo, ya que la delimitación de los datos mediante comas les confiere su propio "campo".
Se entiende desde dos ángulos. El primero tiene que ver con la capacidad de una organización de utilizar los datos para tomar decisiones basadas en ellos. El segundo consiste en la unión y las conexiones entre la cultura, el arte y los datos. En cualquier caso, habla de la apropiación de los datos para llevar a cabo acciones conscientes.
Una spline es una función matemática que genera una curva suave y continua a partir de puntos de datos, ajustándose a ellos con precisión. Es utilizada en gráficos computarizados, modelado geométrico y análisis de datos para conectar puntos con transiciones fluidas. Permite crear formas complejas con control sobre la curva, minimizando saltos entre segmentos. Herramientas como PowerPoint o Illustrator facilitan su visualización con opciones de "línea curva".
Los datos abiertos son datos a los que cualquiera puede acceder, distribuir y copiar libremente. Son datos "públicos" y, como tales, no están protegidos por derechos de propiedad intelectual.
Los datos categóricos son aquellos que se pueden dividir en grupos o categorías.
Los datos no estructurados suelen ser datos cualitativos y suelen almacenarse en bases de datos NoSQL. Son útiles, pero algunas veces no son tan prácticos a efectos de análisis y generación de información, pues no se pueden visualizar bien en herramientas de análisis como los gráficos y las tablas. Algunos datos de este tipo son los vídeos, el audio o las imágenes de satélite.
Los datos discretos son un tipo de datos cuantitativos que incluyen cifras y estadísticas de puntos de datos individuales no divisibles que se pueden contar. Los puntos de datos discretos suelen escribirse como números que representan valores exactos, y los datos discretos suelen representar eventos únicos que ya han ocurrido.
Los datos en bruto son datos que no han sido procesados ni transformados de ninguna manera. Son datos que se han tomado directamente de la fuente.
En la mayoría de los casos, los datos estructurados son datos cuantitativos. Son fáciles de organizar en hojas de cálculo, bases de datos relacionales y de visualizar. Algunos ejemplos son los nombres, los números de pedido y la geolocalización. Es más fácil generar información a partir de datos estructurados que de datos no estructurados.
Los datos numéricos son un tipo de datos expresados en números. A veces se denominan datos cuantitativos y se diferencian de otros tipos de datos en forma de número por su capacidad para realizar operaciones aritméticas con estos números.
En ocasiones, quienes producen y gestionan datos o información para el consumo público son personas que ocupan posiciones de poder y deciden qué información mostrar. Sin embargo, cada vez más, cualquiera puede crear, utilizar datos y tomar decisiones a partir de ellos, esto es lo que se conoce como democratización de los datos.
Los programadores back-end están especializados en el "detrás de escena" de un sitio web o software. Se ocupan de cómo funcionan las cosas por dentro, crean los componentes a los que accede el usuario a través de la aplicación front-end.
Algunos programadores se especializan en crear la "fachada" o interfaz gráfica de un sitio web o software, con la que los usuarios interactúan. Mientras que los desarrolladores de back-end se concentran en la construcción de componentes y funciones que hacen funcionar un sitio web o un software, los desarrolladores de front-end construyen las aplicaciones que permiten a los usuarios acceder a estos componentes.
Un desarrollador full-stack puede trabajar tanto en desarrollo de back-end como front-end, por lo que tienen una visión general de todos los aspectos de la construcción de un sitio web o software.
En estadística, es un medio para describir el grado de distribución de los datos en torno a un valor o punto central. Ayuda a comprender la distribución de los datos. Una menor dispersión indica una mayor precisión en el proceso de fabricación o en las mediciones de datos, mientras que una mayor dispersión significa una menor precisión.
Un archivo .docx es un archivo de documento en formato XML abierto de Microsoft Word. Son más pequeños y más fáciles de soportar que los archivos .doc porque el formato está basado en XML y todo el contenido se almacena como archivos separados, y finalmente se compacta en un único archivo comprimido en ZIP.
Integrar o incrustar contenido, como videos, gráficos o aplicaciones, dentro de una página web u otra plataforma. Permite visualizar recursos externos sin salir del entorno actual.
Es un valor numérico que ha sido calculado y que caracteriza algún aspecto de un conjunto de datos de la muestra. Suele servir para estimar el verdadero valor de un parámetro correspondiente en una población subyacente.
La Experiencia de Usuario busca entender cómo reaccionan y se sienten los usuarios ante determinados productos digitales, como sitios web o aplicaciones. Los diseñadores de UX, a partir de metodologías centradas en el usuario, crean interfaces que pretenden maximizar la interacción y que se estimulen su comportamiento.
Es el proceso por el cual los datos se toman de una fuente y se trasladan a un contenedor - o una base de datos - más grande con muchos otros datos. Su nombre describe el proceso: los datos se toman ("extraen") de una fuente, se convierten ("transforman") en un formato uniforme y se colocan ("cargan") en un almacén más grande. Este proceso busca facilitar la manipulación de los datos y su almacenamiento de forma lógica, para favorecer su uso.
La gestión de datos describe el proceso de recopilación, catalogación y procesamiento de datos dentro de una organización para lograr un determinado resultado. Cada vez más organizaciones adoptan "sistemas de gestión de datos" que permiten simplificar los procesos de datos. Estos sistemas de gestión de datos quieren convertir la gestión de datos en una actividad cotidiana para el personal no técnico.
Conjunto de normas, procesos y arreglos institucionales que gestionan el uso responsable de los datos para maximizar su valor sin comprometer derechos. Implica coordinación entre entidades, adopción de estándares comunes y consulta con grupos de interés, equilibrando apertura, protección, innovación y regulación.
El gobierno abierto es un modelo de gobernanza que reconoce que los ciudadanos tienen derecho a acceder a los documentos y procedimientos del gobierno. El concepto tiene un amplio alcance, pero suele estar relacionado con las ideas de acceso a la información, participación, rendición de cuentas, innovación, coordinación gubernamental, integridad, compromiso cívico, transparencia presupuestaria y lucha contra la corrupción.
Es un encuentro entre desarrolladores, científicos de datos y otros perfiles relacionados, en los que se trabaja intensamente en un proyecto determinado durante un periodo de tiempo concreto. Pueden surgir para idear soluciones para proyectos específicos de la organización o incluso para dar solución a problemas globales.
La PII es el nombre que se le da a cualquier información relacionada con un individuo específico. Puede tratarse de información muy básica, como un nombre o un número, o de información muy sensible, como datos bancarios o historiales médicos. Dado que la PII puede decir algo sobre personas privadas, suele estar regulada por la legislación de protección de datos.
Sistemas y recursos necesarios para recolectar, almacenar, procesar y compartir datos.
Un ingeniero de datos crea estructuras para albergar y conectar datos. Para que un científico de datos pueda analizar grandes conjuntos de datos, primero necesita un ingeniero de datos que construya los mecanismos necesarios para recoger y procesar estos datos.
Conocimiento o conclusión valiosa obtenida a partir del análisis de datos o información. Ayuda a comprender tendencias, resolver problemas o tomar decisiones estratégicas.
La integración de datos es una vertiente de la gestión de datos que se concentra en unir datos procedentes de muchas fuentes diferentes. Integrar los datos adecuadamente minimiza el margen de error en todas las decisiones basadas en datos que toma una organización.
Tecnología que simula capacidades humanas como aprendizaje, razonamiento o percepción, utilizada en aplicaciones como chatbots, asistentes virtuales o sistemas de recomendación.
API es la abreviatura de Application Programming Interfaces o, en español, interfaz de programación de aplicaciones. Es un mecanismo que permite a dos componentes de software de una aplicación integrarse o comunicarse entre sí a partir de un conjunto de definiciones, protocolos y reglas. Un ejemplo analógico puede ser la carta de un menú, en ella tienes una serie de platos (peticiones que un componente hace a otro), cuando eliges el tuyo, en la cocina sabrán lo qué quieres y podrán empezar a cocinarlo.
La interfaz de usuario es la parte de un software que permite al usuario interactuar directamente con él. Un sitio web o un micrositio son interfaces de usuario comunes que puede contener numerosos elementos interactivos, menús desplegables o barras de progreso.
Cada vez más dispositivos domésticos se conectan a Internet, lo que da lugar al concepto de Internet de las cosas: la integración de objetos cotidianos con la red. En el hogar, esta tecnología busca facilitar la vida de los usuarios, mientras que a mayor escala, impulsa el desarrollo de ciudades inteligentes, optimizando servicios urbanos.
Capacidad de los sistemas y servicios digitales para intercambiar, comprender y utilizar datos de manera fluida y estandarizada. Es un principio fundamental en el desarrollo tecnológico que permite que diferentes plataformas, aplicaciones y bases de datos se comuniquen eficientemente entre sí, independientemente de su arquitectura o proveedor.
Las extensiones de archivo .jpeg o .jpg se utilizan en archivos de imagen comprimidos con el estándar del Joint Photographic Experts Group (JPEG). Admiten hasta 24 bits de color y utiliza una compresión con pérdidas, que puede reducir notablemente la calidad de la imagen si se aplican cantidades elevadas.
La notación de objetos de JavaScript (json) es un formato de archivo estándar abierto y de intercambio de datos que usa texto legible para almacenar y transmitir objetos de datos con pares atributo-valor y matrices.
El lenguaje de programación SQL permite descubrir, editar o eliminar los datos que se encuentran un sistema de gestión de bases de datos relacionales.
Los lenguajes de programación permiten a los humanos interactuar con los ordenadores en términos que ambas partes pueden entender e interpretar. Algunos de los más comunes son Python, JavaScript, C#, C++ y C.
Proceso de preparar los datos para su uso y análisis adecuado. Incluye tareas como corregir valores faltantes, ajustar formatos y verificar la coherencia, garantizando datos fiables y precisos.
El resultado que se obtiene al sumar dos o más cantidades y dividir el total por el número de cantidades. Algunas características de la media es que considera todas las puntuaciones, el numerador de la fórmula es la cantidad de valores y que cuando hay puntuaciones extremas, no tiene una representación exacta de la muestra.
La mediana es el valor que se encuentra en la mitad del resto de valores de una lista de datos dada, cuando está dispuesta en orden. La mediana no depende de los valores de las variables, solamente de su orden y suele calcularse con valores enteros.
Los metadatos son datos sobre datos. Para un dato, suele haber muchos otros metadatos, es decir, piezas de información que describen ese dato. Un buen ejemplo es un documento en tu computador. El documento en sí es el dato, y la información como la hora y la fecha de creación, el tamaño del archivo y la ubicación de almacenamiento son los metadatos.
Datos simples, fáciles de procesar y entender por humanos. Son relevantes para resolver problemas específicos o locales. Por ejemplo, registros de compras en una tienda pequeña.
Página web o conjunto de páginas dedicadas a un tema, campaña o proyecto específico, separadas del sitio principal. Puede ser externo, como un sitio promocional, o interno, diseñado para comunicación y recursos dentro de una organización, como capacitaciones o actualizaciones internas.
Proceso de transferir datos de un sistema o formato a otro, garantizando su integridad y compatibilidad. Es clave en actualizaciones tecnológicas o cambios de plataformas.
El objetivo de la minería de datos es extraer todo el valor y la información "utilizable" posible de los datos sin procesar.
Es el valor que más aparece en un conjunto o grupo de valores. Puede darse el caso en el que en un grupo de valores existan dos o más modas, o que no exista ninguna. Es una muestra muy clara y los valores que se presentan pueden ser tanto cuantitativos, como cualitativos.
Algoritmos de inteligencia artificial entrenados en grandes volúmenes de texto para comprender y generar lenguaje humano de manera coherente. Son útiles en tareas como redacción, traducción y análisis de texto.
Un archivo con la extensión .pdf es un archivo de formato de documento portátil (PDF). Fue creado con dos objetivos, que la gente pudiera abrir los documentos en cualquier hardware o sistema operativo, sin necesidad de contar con la aplicación utilizada para crearlos y que el diseño del documento se mantuviera al abrirse.
Metodología centrada en las personas para resolver problemas de forma creativa. Se enfoca en comprender las necesidades de los usuarios, fomentando la empatía, la ideación y la experimentación. Busca incorporar perspectivas únicas que conecten con los usuarios y generen valor en el producto o servicio.
Es una especialidad del periodismo que investiga mediante la recolección y análisis de datos, normalmente en grandes cantidades, usando software especializado. Este tipo de periodismo hace comprensible la información a la audiencia a través de la narrativa, artículos, visualizaciones o aplicaciones interactivas.
La extensión Portable Network Graphics (PNG) es un formato de archivo de gráficos de trama que realiza una compresión sin pérdidas de la imagen. Se diseñó como una mejora del formato de intercambio de gráficos (GIF) y no está patentado.
Se trata de interfaces de usuario en línea que permiten a los usuarios acceder a colecciones de datos abiertos. Dos de los tipos más comunes de organizaciones que publican datos a través de portales de datos abiertos son los gobiernos y las organizaciones que investigan.
Rama de la inteligencia artificial que permite a las máquinas entender, interpretar y generar lenguaje humano. Se usa en tareas como traducción automática y chatbots.
La proporción, en general, se refiere a una parte, cuota o número considerado en relación comparativa con un todo. Si dos conjuntos de números dados aumentan o disminuyen en la misma proporción, entonces se dice que las proporciones son directamente proporcionales entre sí. 2/4 es proporcional a 4/8 y a 1/2.
Tecnología que convierte texto impreso o escrito a mano en imágenes digitalizadas en texto editable. Es útil para digitalizar documentos, extraer información y automatizar procesos.
El scraping de datos es una forma de obtener datos de un sitio web en un archivo local del ordenador, como una hoja de cálculo.
Los sistemas de gestión de datos permiten a las organizaciones maximizar la información que pueden obtener de sus datos. Gracias a ellos, pueden cotejar todos sus datos, recopilar datos de fuentes externas a su organización, consultar los datos en su base de datos para identificar o descubrir nueva información.
En algunas ocasiones, las organizaciones optan por suscribirse a servicios de software en vez de instalar software caro y complejo. Estos servicios, normalmente están disponibles en línea y no están vinculados a un dispositivo específico. Una ventaja añadida del SaaS es que sólo se paga por lo que se consume, como si el software fuera una tarifa de servicios.
El software de código abierto es libre y no está restringido por derechos de autor. Su código puede ser visto y modificado por cualquier persona con conocimientos de programación.
El software propietario (también conocido como software de código cerrado) no es de uso libre y está protegido por derechos de propiedad intelectual, como los derechos de autor. A diferencia del software de código abierto, el software propietario no permite a los usuarios finales ver o modificar el código fuente.
Técnica para comunicar hallazgos de datos de forma clara y persuasiva, combinando visualizaciones, narrativas y contexto. Ayuda a transformar datos complejos en mensajes comprensibles y accionables.
Interfaz visual interactiva que centraliza y presenta datos clave mediante gráficos, mapas y tablas dinámicas, permitiendo filtrar, explorar y analizar información.
Tecnologías y herramientas digitales que fortalecen la participación ciudadana, mejoran servicios públicos y fomentan la transparencia. Por ejemplo, plataformas para seguir presupuestos públicos o reportar problemas en el transporte urbano.
Método de desarrollo de software que utiliza herramientas visuales y componentes predefinidos para crear aplicaciones con mínima escritura de código. Acelera el desarrollo y reduce costos.
En informática, se denomina texto plano al que no tiene ningún tipo de formato.
Proceso de sustituir datos sensibles con identificadores únicos o tokens, que no tienen valor fuera de su contexto. Protege información como números de tarjetas o datos personales.
Principio que garantiza la explicación clara del funcionamiento de algoritmos, decisiones y datos usados.
Un archivo TXT es un documento de texto estándar que contiene texto plano o sin formato. Puede abrirse y editarse en cualquier programa de edición o de tratamiento de textos.
Es la medida de la cantidad de variación o dispersión que tiene un conjunto de datos. Muestra, por término medio, a qué distancia se encuentra cada valor de la media.
Combinación de mapas y datos para analizar fenómenos con una dimensión espacial.
WebP es un formato desarrollado por Google. Está basado en el códec de vídeo VP8 y ofrece imágenes ricas y de alta calidad en un tamaño menor que PNG o JPEG.
Un archivo XLS es un archivo de hoja de cálculo creado por Microsoft Excel o exportado por otro programa de hoja de cálculo. Contiene una o más hojas de cálculo, que almacenan y muestran datos en formato de tabla. Los archivos XLS también pueden almacenar funciones matemáticas, gráficos, estilos y formatos.
Un archivo con la extensión XLSX es un archivo de hoja de cálculo con formato XML abierto exclusivamente por Microsoft Excel. Es un archivo comprimido en ZIP y basado en XML creado por Microsoft Excel versión 2007 y posteriores.