sábado, 25 de marzo de 2017

Los sistemas de búsqueda. Google.




Esta entrada va a tratar sobre como encontramos actualmente la información, es decir trataremos sobre los diferentes motores de búsqueda. Además se contestara a  dudas sobre el buscador  Google, ¿Por qué es el mas utilizado?¿Nos muestra información sesgada? ¿Cuál ha sido la respuesta de la UE?





En la actualidad toda la información se busca a través de las Herramientas de búsqueda en Internet. Los más populares son: los motores de búsqueda horizontales (Google, Bing, Yahoo), verticales y singulares (Wolfram alpha, Zanra, Factbites), estos últimos buscadores están especializados en una atarea específica y están diseñados para brindar información desde un enfoque; los directorios de preguntas y marcadores sociales (Quora, Yahoo Respuesta, Reddit); y los metabuscadores (Copernic, OJOSE, Yippy) esta herramienta permite realizar búsquedas de información en varios motores de búsqueda al mismo tiempo.  
Las Herramientas de búsqueda de información no convencionales son: Directorios y Motores de búsqueda académicos o de investigación( Open Directory Project) y Directorios de patentes (WIPO).



Fuente: http://www.culturaseo.com/buscadores-web/

Los buscadores más importantes son:
  •  Google: este buscador tiene su propio algoritmo, es rápido y efectivo en la búsqueda e innova en los anuncios publicitarios, además tiene buscadores temáticos con las mismas características que el buscador general.
  •  Yahoo: es un buscador innovador y que hace poco tiempo empezó a trabajar con Google, destaca por la difusión de su uso y la gama de servicios que presta.
  • Baidu: Es uno de los principales buscadores del mundo gracias a su implantación en China, un país con mil millones de usuarios potenciales. Las posibilidades del buscador oriental son las misma que ofrece Google, con una aplicación capaz de encontrar documentos sonoros. 
  • Bing: se trata del antiguo buscador "Live Search" , buscador original de Windows. Desde 2009 ofrece una lista de búsqueda y otra de su empresa matriz, sin embargo es difícil que de momento compita con el otro gigante americano de Internet. 

Los buscadores menos utilizados son:
  •  WikiaSearch: creador por los autores de Wikipedia, es uno de los buscadores de código abierto transparente y colaborativo. Este proyecto se acabó el 14 de mayo de 2009. 
  •  Go: es un portal web lanzado por primera vez por Jeff Gold, y es operado actualmente por Walt Dsiney Internet Group. El portal incluye contenido sed ABC NEWS, ESPN Y FamilyFun.com. Se demostró que  este buscador fue un fracaso costos, ya que los usuarios de Internet prefieren utilizar los motores de búsqueda para acceder al contenido directamente, en lugar de comenzar en un portal corporativo de nivel superior. 
  • Altavista: al principio fue un buscador muy asertivo y visitado, destaca por la rapidez de búsqueda de la información y su exactitud. Su innovación al mundo tecnológico fue la posibilidad de traducir online cualquier página consultada.
  •  Ozú: este motor de búsqueda fue creado en España a principios del año 1996, se basa en dar un servicio personalizado a los usuarios de Internet, donde ofrece servicios lideres entre los usuarios españoles: chat, humor, noticias... Cuenta con una amplia variedad de canales verticales y servicios interactivos y el resultado final es una navegación intuitiva y funcional. 
  •  Yoople: ( Yahoo+ Google+ People) este buscador permite modificar le orden de los contenidos ofrecidos, para que el sistema aprenda sobre las preferencias. Se hizo esta colaboración para conseguir búsquedas más eficientes. 
  • Kartoo: es uno de los primeros metabuscadores con interfaces gráfica, destaca por la exactitud en la búsqueda. Actualmente Kartoo comercializa herramientas de intranet para las empresas, pero conserva la gratuidad de su buscador.
  • Touchgraph: este buscador muestra como se conforma la red de una dirección en función de los enlaces a los que apunta y los enlaces que apuntan a él, este buscador permite modificar la posición gráfica de forma sencilla.
  • Grokker: es la última generación de metabuscadores, permite realizar la búsqueda con independencia del navegador con el que se trabaja, porque es una aplicación que se instala en el ordenador de forma residente.

¿CÓMO SE BUSCA LA INFORMACIÓN?


1º Planificación de la información, se define el objetivo de búsqueda, plantear las estrategias y tácticas posible. Reflexionar sobre ellas y tratar de ordenarlas según su eficacia y eficiencia prevista.
2º No todo es Interent y en Internet no todo es el World Wide Web. 
3º Combine varios buscadores y estrategias 
4º Lea las paginas de ayuda de los buscadores, usualmente se trata de sencillos consejos y cuya lectura nos puede ahorrar muchas horas de búsqueda infructuosa. 
5º Anote los resultados de la búsqueda, por ejemplo bookmmarks. 


Búsquedas temáticas complejas 
1º Identificar conceptos .
2º Sintetizar las palabras claves. 
3º Determinar si hay sinónimos, términos relacionados u otras variaciones que sea conveniente. introducir en la búsqueda.
4º Combinar los términos.
5º Elegir la base de datos o el motor de búsqueda.
6º Familiarizarse con las características de las bases de datos.
7º Expresar la búsqueda en función de las posibilidades de la Base de Datos. 
8º Evaluar los resultados.
9º Replantear a estrategia en los pasos 2-4. 


GOOGLE 




El buscador mas utilizado en Internet con más del 67% de usuarios de la red. EL objetivo principal del buscador de Google es ofrecer contenido de alta calidad en las páginas web, en lugar de otro tipo de datos. Una de las ventajas de este buscador es estar disponible para una gran cantidad e sistemas operativos. 
Google, es el buscador mas popular  y poderoso y ha crecido hasta el punto que la empresa hoy tiene servicios de telefonía, un sistema operativo para móviles y muchos otros negocios, pero la publicidad y la búsqueda de paginas web sigue siendo la mas rentables. 

La historia de Google:
Larry Page y Sergey Brin se conocieron en 1995, cuando tenían 24 y 23 años respectivamente, en un acto organizado por la Universidad de Stanford. 

Ambos tenían un objetivo en común: conseguir información relevante a partir de una importante cantidad de datos. En enero de 1996 iniciaron su colaboración en un buscador llamado BackRub

Larry empezó a trabajar en la forma de conseguir un entorno para los servidores que funcionara con PCs de gama baja y que no necesitará de potentes máquinas para funcionar.

Un año después, la tecnología utilizada por BackRub para analizar los links empezaba a ser conocida en todo el campus, obteniendo una gran reputación. Era la base sobre la que se construiría Google.
El nombre proviene de un juego de palabras con el término “googol”, acuñado por Milton Sirotta, sobrino del matemático norteamericano Edward Kasner, para referirse al número representado por un 1 seguido de 100 ceros. El uso del término refleja la misión de la compañía de organizar la inmensa cantidad de información disponible en la web y en el mundo. 




¿ La información esta sesgada?
El buscador por excelencia muestra resultados de búsquedas sesgados que favorecen sus propios servicios, lo que provoca un daños sobre el consumidor. Estas conclusiones son de un estudio publicado por Tim Wu, padre del concepto de neutralidad de la red. Para evaluar el daño de estas prácticas, se hizo una encuesta  que mostraban dos resultados de búsquedas en Google sobre restaurantes y hoteles. En uno de ellos estaban ordenados según la relevancia con las puntuaciones obtenidas de YELP Y Tripadvisor. En la otra, se mostraba el resultado real que ofrece la empresa, en el que da prioridad a sus plataformas.  Los resultados mostraban que le 47% de los usuarios prefería las búsquedas no sesgadas. Los usuarios no son los únicos afectados en este modus operandi, porque el impacto también se dirige a direcciones del mercado, ya que los consumidores no consiguen los resultados y productos mejor valorados y por las empresas que se lo podrían haber vendido. La Comisión Europea acuso formalmente a Google del abuso de posición dominante por un motivo similar: favorecer sistemáticamente su servicio de comparación de precios en los resultados de búsquedas frente a sus rivales. 

En conclusión, la información sesgada hace daño tanto al consumido cromo al mercado, por lo que  a largo plazo podría crear un monopolio de empresas llegando a afectar a la economía, por lo tanto creo que debería de haber medidas legislativas. 



Bibliografía :
https://platzi.com/blog/historia-de-google/
http://www.elconfidencial.com/tecnologia/2015-06-30/google-tim-wu-busquedas-yelp_908974/

http://www.vix.com/es/btg/tech/12948/los-mejores-buscadores-ademas-de-google
https://www.todoprogramas.com/navegadores/navegadores-de-internet-mas-utilizados/
http://zonadigital.excite.es/cuales-son-los-buscadores-de-internet-mas-utilizados.html
http://buscadores.about.com/od/conceptosbasicos/tp/Los-Buscadores-M-As-Populares-De-Internet.htm










domingo, 12 de marzo de 2017

Sistemas de Almacenamiento Actuales



En esta nueva entrada del blog vamos a tratar sobre los sistemas de almacenamiento desde el punto físico y lógico, hablando desde los Discos Duros hasta la polémica Nube. En este capítulo hablaremos también de las Bases de Datos, ya que son muy útiles y accesibles para todos los usuarios,aunque estos no tengan conocimientos informáticos. El uso de las Bases de Datos es muy importante por lo que en esta entrada aprendemos desde su historia hasta claves para su manejo. 


Hay dos puntos de vista; el físico y el lógico. Los sistemas de almacenamiento desde el punto de vista físico son los soportes de almacenamiento, Disco Duro, electromagnético; DVD, laser; cintas..

Estos sistemas tienen como características comunes, capacidad de almacenamiento de la información y  velocidad en la transferencia para que el ordenador lo lea de forma correcta. 
Desde el punto de vista lógico hay dos sistemas, los Archivos; almacenados en ficheros donde el propietario del programa guarda de forma individual. Ejemplos: word.DOC ( extensión y programa). En el mundo de la imagen, video... todos tienen su propio formato. 



El otro sistema de almacenamiento desde el punto de vista lógico son las Bases de Datos; surgieron de los sistemas de archivos,  sistema de  almacenamiento de información que usaba información reutilizada. Este sistema tenia numerosas desventajas como la redundara de los datos, el alto coste para la programación de cambios,  dificultades en la combinación de datos e inconsistencia debido a actualizaciones simultáneas. 
Las Bases de Datos surgen por la necesidad de solucionar estas desventajas o debilidades de los sistemas de archivos. Las BD, coleccionan información homogéneas. Sus capacidades son un manejo de forma persistente, soporte de un modelo de datos y lenguaje de alto nivel; control de accesos y evita inconsistencias al compartir la información. 
Las Bases de Datos están en todas partes, desde el supermercado de tu barrio hasta en el sistema del gobierno. Las Bases de Datos son muy útiles, ya que tiene registros de otras Bases de Datos, haciendo un conjunto estructurado de datos coherentes(verdaderos ), que bien un significado implícito, se atribuye dependiendo del contexto en que se utilizan los mismo. 
Por ejemplo, el dato fecha en una base de datos de una empresa puede referiste a la fecha en la que se pagan a los proveedores o trabajadores. 



Definiciones necesarias para entender una Base de Datos:

1)DATOS: Es un elemento aislado, recabado para un cierto fin, pero que no ha pasado por un proceso de interpelaciones con otros. Los datos son símbolos que describen condiciones, hechos, situaciones o valores. Los datos se caracterizan por no contener ninguna información. Un dato puede significar un número, una letra, signo ortográfico o cualquier símbolo que represente una cantidad, una medida, una palabra o una descripción . 

2)ENTIDADES: Es todo aquello de lo cual interesa guardar datos, por ejemplo: DNI, clientes, proveedores, trabajadores. En el Modelo de Entidad- Relación, se observa que la entices están formadas por atributos o campos referidos a un mismo tema que interesa almacenar. 
Las Bases de Datos se componen de tablas, registros y campos. La tablas son unidades donde crearemos el conjunto de datos de nuestra base de datos. Estos datos estarán ordenados en columnas verticales. Los campos son los distintos tipos de datos que componen la tabla y los registros constituyen la información que va contenida en los campos de la tabla. 

3)CLAVE PRIMARIA O CLAVE PRINCIPAL: Es un campo o una combinación de campos que identifica de forma única a cada registro de una tabla. No puede haber dos registros en una tabla que tengan la misma clave primaria. 

 4)CLAVE FORÁNEAS: Están endentó de una entidad donde hay claves primarias de otras entidades, estas calles primarias serian las claves foráneas. A tres de esto se hace la relación de entidades. 
La creación de relaciones y combinaciones entre tablas en nuestra base de datos nos supone la ventaja de tener toda la información que necesitamos almacenada en varias tablas, relacionadas entres sí, en lugar de una única tabla de gran tamaño con toda la información. Al hacer uso de las relaciones se evitan datos duplicados. 
Podemos distinguir tres tipos de relaciones diferentes:
    1)Uno a uno. Cuando un registro de la tabla principal sólo puede estar relacionado con un registro de la tabla secundaria y viceversa. Por ejemplo, país y presidente.
    2)Unos a muchos. Cuando un registro dela tabla principal puede estar relacionado con muchos registros de la tabla secundaria, pero un registro de la tabla secundaria sólo puede estar relacionado con uno de la tabla principal. Por ejemplo, un censo de población.
    3)Mucho a muchos: Cuando un registro de la tabla principal puede estar relacionado con muchos registros de la tabla secundaria y viceversa. Por ejemplo, clientes y artículos que compra. 
Referencia al libro de la asignatura de TIC.  

5)INDICES: Es una estructura de datos que mejora la velocidad de las operaciones, permitiendo un rápido acceso a los registros de una tabla en una BD sencilla.

6) INTEGRIDAD REFERENCIAL: Sistema de reglas para asegurarse que los registros de tablas relacionadas son válidos y que no se borren o cambien datos relacionados de forma accidental produciendo errores de integridad. 

7)METADATOS: Son datos acerca de los datos presentes en la Base de Datos.

8)SISTEMA DE GESTION DE BASE DE DATOS(SGBD): Es un software que permite manipular la Base de Datos. Cuando nos referimos a manipular un BD, hablamos de construir, utilizar, mantener y reorganizar una BD. Las propiedades fundamentales son la independencia de los datos; acceso eficiente  los datos; integridad y seguridad de los datos; administración de los datos y acceso concurrente y recuperación en caso de crash. 
Los SGBD deben cumplir las propiedades ACID( Atomicidad, Consistencia, Aislamiento y Durabilidad)

9) ESQUEMA DE UNA BASE DE DATOS: Estructura en la que se organizan los datos en BD, esta estructura es estática durante un gran periodo de tiempo, aunque puede sufrir modificaciones ocasionales. 

10) INSTANCIA: Información que en un determinado momento del tiempo posee la base de datos y que cambia permanentemente. 

11) USUARIO FINAL: Persona que interactúa con la base de datos a través de aplicaciones. 

12) USUARIO ESPECIALISTA: Diseñador y programador de la BD.

13) DBA( DATABASE ADMINISTRATOR): Administra la BD

Componentes funcionales de un SGBD 
1-Metadatos: contine el esquema de la B, usuarios, permisos... Almacena la información que permite la traducción entre los 3 niveles de la Arquitectura ANSI/SPARC
2-Optimizador de consultas: define le plan de ejecución de operaciones solicitadas por los usuarios, de tal manera que se lleven a cabo de la manera más eficiente posible. 
3- Manejador de transacciones: controla el accesos y la concurrencia de operaciones.
4- Manejador de almacenamiento: dentro de este hay dos componentes:
     >Manejador de archivos, recupera del disco bloques que contiene información  
     >Manejador de buffer, mantiene en memoria la información más usada y decide cuando llevarla al disco duro alguno de sus bloques.

Funciones de una SGBD 
1-Soportar DML(lenguaje para actualización, almacenamiento y recuperación de datos).
2-Ofrece optimización en la búsqueda de la información. 
3-Soporta DDL ( lenguaje para definir los datos).
4-Metadatos(DD); informa sobre los objetos existentes en el sistema.

Ventajas de un SGBD  son la reutilización de datos que evita la redundancia, estandarizan, la consistencia, se pueden establecer prioridades; integridad de datos establecidas por el usuario, seguridad, rapidez de desarrollado y mantenimiento de la estructura de datos-  

Desventajas de un SGBD son el gran tamaño que ocupa en la memoria, dependiendo del programa puede ser mas susceptibles a fallas o no; puede trabajar de forma lenta debido a las verificaciones que debe hacer. 


Niveles de Abstracción (ANSI/SPARC); el objetivo de esta arquitectura es independencia de los datos; prometiendo modificar la definición de un nivel sin afectar el nivel superior. Sin esta independencia se requeriría de mucho esfuerzo para cambiar las aplicaciones. Hay dos tipos de independencia:
1)I. Física: inmunidad que tiene los usuarios y las aplicaciones ante los cambios en la forma de almacenar físicamente los datos. Se presenta entre los niveles conceptual y físico. Un cambio en este esquema no conduce a cambios en el esquema conceptual, ya que hay INMUNIDAD del esquema conceptual ante cambios del esquema físico.
2)I. Conceptual o lógica: inmunidad que poseen los usuarios y las aplicaciones ante los cambios en la estructura lógica de la base de datos. Se presenta entre el nivel de visión y el nivel conceptual. Un cambio en el nivel conceptual no debe conllevar a un cambio en el nivel de visión. Esta independencia es más difícil de lograr por la adiccion de nuevos elementos o eliminación de elementos, ambas pueden afectar a los subesquemas externos del usuario. 

En el nivel externo, hay una percepción de la base da datos por parte de los usuarios final, no hay una única forma de ver este nivel sino que hay tantas como tipos de usuario, aunque sean representaciones distintas de los mismo datos. Además, cada visión de usuario final se puede caracterizar como un subesquema. 
Por Ejemplo:
-Datos AGRUPADOS: totales
-Datos Derivados: sueldo total 
-Datos Calculados: Edad de una persona
Los últimos tipos de datos podría usarse para definir un dato que se genera a partir de otro(s).Pueden haber  su vez datos agregados derivados, datos agregados calculados, etc. 

En el nivel conceptual, es el mediador de los otros dos niveles y es interesante para usuarios especializados. Este nivel se ocupa de los datos almacenados en la base de datos física y las relaciones entre ellos; también hace una descripción semántica de los datos que conforman la base de datos y soporta cada una de las visiones externas de los usuarios. 
El nivel conceptual e s una visión completa de todos los requerimientos y elementos de interés para la organización,  este nivel incluye además restricciones sobre los datos. Este nivel esta asociadas a un lenguaje de alto nivel. 

El nivel físico, es el nivel más interno, es decir es el mas cercano a la máquina. Este nivel solo interesa al Administrador y al usuario especialista. En este nivel se describe cómo son los datos almacenados en términos de estructuras de datos particulares; cabe destacar, que este nivel se encarga de reservar espacio para datos e índices, de la compresión de datos y de las técnicas de encriptamiento de datos.



Tendencia de los SGBD
La tendencia de este sistema es ser soporte de toma de decisiones y/o con capacidades deductivas y bases de datos temporales, hacer un manejo de información multimedia, georreferenciada y documental. Este sistema hace que las Bases de Datos se oriente a objetos y objeto- relacione. Además, son las bases nativas para XML. 





LA NUBE
La nube de Internet es un nuevo modelo de uso de los equipos informáticos. Traslada parte de los  archivos y programas a un conjunto de servidores a los que puedes acceder a través de Internet. Permite almacenar tus datos es servidores repartidos por todo el mundo. 
Es muy probable que ya estés utilizando la nube aunque no seas consciente. Piensa en tus cuentas en las Redes Sociales, donde has publicado mensajes, fotos, vídeos...ninguno de estos datos ni las aplicaciones con las que los manejas en Internet están en tu equipo. Todo se guarda en la nube y se usa con los programas almacenados también en ella. 


Las ventajas de la nube son el acceso desde cualquier sitio y con varios dispositivos, todo el software está en un solo sitio, por ello se ahorra software, hardware y mantenimiento técnico, es escalable ( responde a necesidades más exigentes). Los inconvenientes de la nube es la falta de seguridad y privacidad  y la dependencia a Internet.
Para evitar los inconvenientes de la nube hay que hacer copias de seguridad, ser consciente de lo que se publica porque  puede ser apropiado por usuarios desconocidos y cambiar tus contraseñas con frecuencia. 



En conclusión, el almacenamiento de datos es muy importante para el progreso del ser humano pero tiene riesgos, ya que  si no se es consciente de que existen numerosas formas de conseguir información sensible de los usuarios se pueden sufrir horribles consecuencias, como por ejemplo la difusión de fotos, robo de identidad, chantajes... Por ello es necesario que toda la población fuera tuviera conocimiento de las formas en la que puede proteger todos esos datos, desde un sistema de verificaron de pasos hasta una simple correcta configuración de las aplicaciones.



Bibliografía 

1- Libro de TIC
2-www.windowsespanol.about.com
3-www.maestrosdelweb.com