Seu Curso

  • Full Screen
  • Wide Screen
  • Narrow Screen
  • Increase font size
  • Default font size
  • Decrease font size

Apache Cassandra

Imprimir
Avaliação do Usuário: / 5
PiorMelhor 


De inicio, o servidor Apache é o responsável por disponibilizar as paginas web e recursos que você pode acessar. Ex, quando você faz alguma compra online um servidor WEB (ou um conjunto de servidores) é responsável por processar as informações.


Servidor Apache Cassandra

Foi desenvolvido inicialmente pelo Facebook como open source em 2008, agora é mantido por desenvolvedores da fundação Apache e colaboradores de muitas empresas. Cassandra exerce com excelência a função de recolocação de dados. Desenvolvido em plataforma Java o Cassandra não apresenta a sobrecarga de recursos do banco de dados convencionais.

O projeto se baseia na tecnologia emergente NoSQL e encontra-se incubado pela fundação Apache. Cassandra é usado pela NetFlix, eBay, Twitter, Reddit e muitos outros , é um dos mais populares bancos de dados NoSQL de uso hoje.

De acordo com o site, a maior instalação Cassandra conhecido envolve mais de 300 TB de dados sobre mais de 400 máquinas. O novo recurso (Large Row Support) que permite que o banco armazenar 2 bilhões de colunas em uma linha, isso foi disponibilizado na versão 0.7. Era possível armazenar aproximadamente 2GB de dados em uma linha porem esse limite máximo foi removido. O Cassandra é um banco de dados não-relacional (NoSQL), os bds desse tipo tem a vantagem de armazenar fácil e rapidamente uma grande quantidade de dados em um ambiente de clusters.

Quando o cluster para o Apache Cassandra é criado um ponto importante é conhecer duas partições.

RandomPartitioner (RP): Este particionador distribui aleatoriamente os pares de valores chaves sobre a rede, o que resulta em um bom balanceamento de carga. Comparado a OPP, mas nós temos que acessar para obter um numero chave.

OrderPreservingPartitioner (OPP): Esse particionador distribui os pares de valores-chave de uma forma natural. A vantagem é que não precisa acessar para ter o numero da chave e a desvantagem é a distribuição desigual dos pares de valor-chave.


Surpresas consideraveis


Sem chaves estrangeiras: O Cassandra não suporta chaves estrangeiras, portanto, não pode gerenciar a consistência de dados para o usuário. Por isso, o aplicativo deve lidar com a consistência de dados


As chaves devem ser exclusivas: Cada chave (por exemplo, chaves de linha e chaves de coluna) deve ser exclusiva em seu escopo. Caso a mesma chave seja usada duas vezes, os dados serão sobrescritos. Na internet há duas soluções para isso. Primeiro, é possível usar uma chave composta. Em outras palavras, criar a chave combinando vários campos. Essa solução é usada frequentemente com chaves de linha. A segunda solução, quando há o risco de uma mesma chave ocorrer duas vezes, é incluir na chave um valor aleatório ou registro de data e hora. Isso frequentemente acontece com índices, quando um índice armazena um valor como nome da coluna. Por exemplo, no aplicativo de classificação de livros, a classificação foi usada como nome da coluna. Para evitar que duas entradas tenham o mesmo nome de coluna por terem a mesma classificação, o registro de data e hora é incluído após o nome.

 

Recuperação de falhas é manual: Quando um nó em um cluster do Cassandra falha, o cluster continua funcionando se houver réplicas. A recuperação completa, que é redistribuir dados e compensar pelas réplicas perdidas, é uma operação manual através da ferramenta de linha de comandos chamada ferramenta node .enquanto a operação manual é realizada, o sistema ficará indisponivel.


Essas foram algumas que encontrei na internet e achei que seria bom colocar aqui, existem varios tutoriais de como começar a utilizar o Cassandra, e todos demonstram confiança de dados.

 


Adicionar comentário


Código de segurança
Atualizar

You are here: