Software-defined Network para decisões inteligentes no fluxo de dados em Big Data

1.     Introdução

O presente trabalho é uma resenha do experimento intitulado “Leveraging the Big Data Produced by the Network to Take Intelligent Decisions on Flow Management.” Nesse estudo, um grupo de pesquisadores analisou a aplicação do Software-defined Network(SDN) em um cenário Big Data, na rede de dados de 3 campos universitários. Basicamente foi um estudo comparativo do tráfego de dados utilizando o SDN e não utilizando esse recurso.
              Nas redes alvo do estudo, foram analisados o grande tráfego de dados, com foco na latência e a taxa de transferência de pacotes. Os pesquisadores provaram que no cenário Big Data em experimento, o SDN gerenciou o fluxo de dados com baixa latência e máxima utilização de largura de banda pelos hosts, com base no tipo de tráfego. Esse resultado se deve ao fato dos pesquisadores utilizarem o SDN com um algoritmo inteligente que maximiza a utilização da largura de banda para conseguir um maior rendimento depois de moldar o tráfego na rede. Ou seja, o algoritmo aprende o melhor caminho para os pacotes trafegarem.
              Esse experimento permitiu concluir que com uma melhor classificação do tráfego da rede, é possível obter um melhor gerenciamento do fluxo. Isto significa que, através a aplicação de inteligência sobre gestão de tráfego de dados, temos uma rede de dados melhor e mais rápida em relação a uma rede tradicional, na qual não existe uma inteligência gerenciando o fluxo.
              Para um melhor entendimento do que é o SDN, no tópico a seguir o conceito irá ser melhor explorado. Além disso, a metodologia do experimento também será abordada.

2.     Software-defined Network (SDN)

Atualmente o Software-defined Network (SDN) se apresenta como uma solução para facilitar o gerenciamento e a configuração de uma rede. O SDN oferece a possibilidade de “programar a rede” em tempo real por meio de uma interface aberta padronizada, com intuito de melhorar seu desempenho e seu monitoramento. O SDN disponibiliza uma nova abordagem para o gerenciamento de tráfego. Essa abordagem consiste em uma estrutura orientada a eventos, além do tráfego ser gerenciado pela introdução de novos conjuntos de políticas para controlar o tráfego e reduzir as complexidades. Resumidamente isso significa, inteligência e melhor estratégia na gestão do fluxo de dados.
              Cabe salientar que a diferença do SDN para as redes tradicionais, é que o SDN centraliza a inteligência de rede em um componente, desassociando o processo de encaminhamento de pacotes de rede (plano de dados) do processo de roteamento (plano de controle). Ressaltando que, as redes tradicionais são descentralizadas. Com isso, o SDN se propõem em ser mais flexível para inserção de novas tecnologias na rede.
              Entre as vantagens do uso do SDN estão:
  • Controle centralizado de vários elementos de rede;
  • Minimiza a complexidade da configuração e das operações da rede ao automatizar uma configuração de alto nível que é convertida em um comportamento de encaminhamento específico dos elementos da rede;
  • Permite a fácil implementação de novos protocolos e serviços de rede por meio de alta abstração de operação.
              Por outro lado, a centralização da inteligência tem suas próprias desvantagens quando se trata de segurança, escalabilidade e elasticidade.

2.1.    SDN e Big Data

Tendo em vista que o SDN suporta grandes quantidades de dados, sua aderência ao Big Data se tornou plenamente viável. Atualmente ele é usado em muitos aplicativos de Big Bata, sendo para agendamento e tratamento de processos em data centers, ou para fornecimento eficiente de dados e otimização conjunta de Big Data.
O SDN e Big Data tipicamente são implementados e endereçados individualmente, mas como ambos estão se popularizando, eles estão trabalhando juntos para melhorar recursos e uso da rede de dados. Hoje o SDN suporta totalmente o Big Data na transmissão, manipulação, processamento e armazenamento. Por sua vez, o Big Data ajuda a SDN a otimizar operações.

3.     O Experimento

O experimento foi realizado com 3 cenários Big Data diferentes, avaliando a latência e a taxa de transferência de dados durante um mês. O tráfego de dados nas redes em estudo era alto, contudo para o experimento foram avaliados apenas dados de Texto, Imagem, Áudio e Vídeo. Os cenários foram:
  • Rede da Universidade de Sargodha: Mais de 3.000 computadores, com 10 controladores e 90 swiches com largura de banda padrão 1.000 Mbps entre os links dentro da rede do campus e a Rede de Educação e Pesquisa do Paquistão (PERN);
  • Colégio Universitário de Agricultura: Mais de 1.200 computadores, com 7 controladores e 50 swiches com largura de banda padrão de 1000 Mbps entre os links dentro da rede do campus e o link PERN para se conectar à Internet;
  • Colégio Médico de Sargodha: Mais de 500 computadores, com 3 controladores e 25 swiches com uma largura de banda padrão de 1000 Mbps entre os links dentro da rede do campus e a associação PERN para conectividade com a Internet.
              O experimento contou com um algoritmo que foi criado para gerenciar o fluxo de pacotes na rede de forma inteligente. Esse algoritmo possuía duas partes principais, sendo a primeira responsável por identificar os elementos da rede e os caminhos utilizados no roteamento de informação. Já a segunda parte era responsável pelo gerenciamento do fluxo das decisões tomadas, com base nos caminhos já percorrido. Podendo ser entendido, como uma inteligência que com base no caminho percorrido, sabe qual o melhor caminho a ser escolhido no futuro.

4.     Resultados

Os resultados do experimento mostraram que a latência da transmissão dos dados foi maior quando não se utilizou o SDN e o algoritmo inteligente para gerenciamento do fluxo de dados. E isso para todos os tipos de dados utilizados, que no caso foram: Texto, Imagem, Áudio e Vídeo, como está apresentado nos gráficos 1 e 2. Os gráficos abaixo de Texto e Áudio mostram também que ocorre um breve momento em que o SDN está semelhante a uma arquitetura padrão, pois o algoritmo ainda está em fase de aprendizagem/treinamento, mas depois que o algoritmo começa a encontrar o melhor gerenciamento do fluxo de transmissão, a latência reduz consideravelmente.



                        Gráficos 1 e 2


Comparando a latência entre os campos universitários, também fica evidente que o uso de um algoritmo inteligente permite uma menor latência de dados, como é apresentado no Gráfico 3 e 4. Visualmente a coluna amarela, da rede sem inteligência se destaca, com uma maior latência.
                                                        Gráfico 3 e 4

5.     Conclusão

Como foi abordado nessa resenha, o experimento desenvolvido apresenta com riqueza de informações a aplicação do SDN em um cenário Big Data e serve como um importante instrumento para ratificar o uso do SDN e algoritmos inteligentes no monitoramento e gerenciamento do fluxo de informações. Exemplo disso são os Gráficos, nos quais é possível verificar que o SDN fornece uma solução que reduz a latência na transmissão de dados no Big Data, após o algoritmo aprender a melhor forma de rotear os pacotes de dados.

6.     Referencias

Bhatti, S. K., Lali, M. I. U., Shahzad, B., Javid, F., Mangla, F. U., & Ramzan, M. (2018). Leveraging the Big Data Produced by the Network to Take Intelligent Decisions on Flow Management. IEEE Access, 6, 12197-12205.

Comentários