Por: Prof. Dr. Sofiane Labidi
Fazer uma
ligação telefônica, gravar um vídeo, efetuar uma compra, elabora um projeto, viajar,
enviar um e-mail, etc. Tudo isso gera informações que, normalmente, são armazenadas
em algum lugar.
Bancos,
companhias aéreas, operadoras de telefonia, etc. são exemplos de empresas e
órgãos que criam e manipulam diariamente grandes volumes de informações.
Você já parou
para pensar na quantidade e variedade de dados que geramos e armazenamos a cada
dia, a cada hora, a cada minuto?Câmaras, radares, satélites, computadores,
celulares, etc. vigiam nosso mundo, fazendo com que, praticamente, tudo o que
acontece seja registrado e armazenado.
Desde a hora
que acordamos até a hora que dormirmos, geramos dados e informações que são convertidos
e armazenados no mundo digital. Os dispositivos
de armazenamento de dados tanto analógicos como físicos (papel, etc.) são pouco
utilizados hoje em dia.
Assim, tudo o
que fazemos no mundo real tem seu reflexo no mundo digital. Há hoje cerca de
500 quatrilhões de arquivos digitais no mundo.
Contudo, o que mais assusta é o fato que o volume de dados digitais está
dobrando a cada ano.
Em 2012, as
informações digitais atingiram cerca de 2 zettabytes (2 trilhão de gigabytes)
superando a Lei de Moore que previa que o poder de processamento/armazenamento
dos computadores dobraria a cada 18 meses (portanto mais de um ano).
A quantidade
dos dados criados e armazenados no mundo de hoje em um único dia é maior do que
geramos em todo o ano de 2000, por exemplo.
Estima-se que, em 2020, sejam gerados cerca de 35 zettabytes (ou seja 35
trilhões de gigabytes de informação), e que o conhecimento deverá dobrar no
mundo a cada 73 dias apenas.
Este avanço extraordinário
no montante das informações geradas necessitade um acompanhamento e de um
grande avanço tecnológico, não só para ter a capacidade de armazenar tudo que
geramos, mas também, e sobre tudo, para saber fazer as perguntas certas diante
dessa montanha de informações.
Quanto mais uma
empresa cresce, mais informações ela gera e consequentemente os seus requisitos
de tecnologia e armazenamento aumentam. Portanto,
a capacidade de armazenar, proteger, e compartilhar quantidades de dados cada
vez maiores, além da capacidade de recuperá-loscom sucesso, rapidez e precisão,
é hoje fundamental para aumentar a competitividade empresarial no mercado.
Assim, é muito
importante para uma empresa ter bastantes dados armazenados. Entretanto, a questão hoje é que de nada
adianta ter muitos dados se nós não sabemos recuperá-los e usá-los para nós apoiar
na tomada de decisão, etc.
É neste
contexto que entra em cena um novo conceito chamado Big Data ou Grandes Dados.Big
Data é um termo em plena expansãoque está se tornando muito popular. Ele é usado para descrever o crescimento,
disponibilidade, e o uso exponencial de informações estruturadas e não
estruturadas nas corporações.
Em termos práticos,
Big Data é o estudo e desenvolvimento de soluções tecnológicas que revolucionam
a forma de como as empresas, organizações, governos, etc. adquirem, processam,
e gerenciam os seus dados.
O uso do Big
Data tem muitas aplicações e benefícios tanto individuais para as pessoas como
para as comunidades, organizações, e a sociedade em geral, como retrata o filme
“Moneyball” (O homem que mudou o
jogo) do ator Brad Pitt, onde um gerente de um time de beisebol usava o Big Data para formar um elenco de excelente
qualidade sem investir muito recurso.
O mercado do Big
Data está em plena expansão movimentando atualmente mais de 26 bilhões de
dólares por ano. Contudo, a maioria das empresas ainda não sabe utilizar o
potencial do big data.
Isto passa
principalmente por um novo entendimento de nosso mundo i.e. uma nova maneira de
apreendê-lo. No passado, nós aprendemos
que o mais importante é dar a resposta da melhor forma possível. Atualmente, no mundo do Big Data, precisamos entender
que o mais importante é como perguntar da melhor maneira possível para garantir
as informações certas e consequentemente às decisões certas.
A grande
questão hoje não é,portanto, porque coletamos
uma grande quantidade de informações? mas sim, o que devemos fazer com elas? e
como? As organizações terão que ser
capazes de aproveitar os dados relevantes e usá-los para poder tomar as
melhores decisões.
O Big Data é baseado
no princípio dos 5 “V”: Valor,
Veracidade, Variedade, Volume, e Velocidade, e segue o modelo “Just in
Time” que é hoje a palavra de ordem dos negócios do mundo globalizado.Isto é muito importante para as
empresas pois lhes proporciona um maior poder e eficiência nas decisão.
As Tecnologias do Big Data, não só apoiam
a coleta e o armazenamento de grandes volumes de dados, como também fornecem a
capacidade de compreender e obter um valor agregado a partir destes, o que
ajuda as organizações a operarem de uma forma mais eficiente e rentável. Usa-se para isto técnicas como Análise de
Redes Sociais, Gestão e Qualidade de Dados, Estatística, Datawarehouse,
Mineração de Dados, Mineração de Textos, CRM, ERP, Marketing Digital, SAP, etc.
Há inúmeras ferramentas de Big Data
disponíveis hoje no mercado como por exemplo a Hadoop da Apache Foundation, MongoDB da MongoDBInc., Splunk da Splunk Inc., e aAmazon
Web Services (AWAS) da Amazon.com que oferece um portfólio completo de recursos
de computação em nuvem (CloudComputing)
para ajudar os usuários a gerenciarem o big data. Recentemente, a IBM criou a Big Data
University para disseminação do conhecimento na área.
Big Data vem revolucionando áreas que vão
desde o combate ao câncer até a espionagem (análise de escutas telefónicas,
e-mails, etc.), passando pelo apoio à tomada de decisão das corporações.
O grande desafio do Big Data hoje é
quando lidamos
com os chamados dados não estruturados que até então só podiam ser
compreendidos por pessoas. São dados de
tipo tweets, posts em chats ou em facebook, geolocalizações, vídeos, etc. Este
desafio toma mais importância ainda ao constatar que os dados não estruturados
representam 85% das informações que as empresas lidam hoje.
É preciso também
resolver problemas do tipo: como enfrentara complexidade do aumento exponencial
do volumes das informações? como e onde armazenar todos os dados? Fazer
backups, etc.? Como fazer a análise dos
dados? Como descobrir quais dados são
realmente relevantes? E como usá-los para um melhor proveito?
Enquanto a
quantidade de informação digitais dobra a cada ano, apenas 22% dessas
informações são úteis, e apenas 5% são analisadas e utilizadas de alguma maneira pelas
empresas,por exemplo em um processo de tomada de decisão.
Isto reforça a
importância do Big Data cujo o mercado crescerá 40% ao ano até 2020.A
quantidade das informações passará de 2 zettabytes hoje a 8 zettabytes no final
de 2015. É o equivalente à capacidade de
armazenamento de 500 bilhões de IPads.
O Big Data é
considerado ao mesmo tempo uma evolução euma complementação do Business
Intelligence (BI) por aumentar ainda mais sua relevância e utilidade para o
negócio. O BI é essencial para o planejamento estratégico organizacional das
empresas e necessita do Big Data para promover mais rapidez e inteligência na tomada
de decisão.