Quanto GB de conteúdo tem toda a Netflix? Alguém pode estimar a capacidade dos seus servidores?
Quantos GB de conteúdo tem toda a Netflix? Qualquer pessoa pode estimar a capacidade dos seus servidores?
Não há uma forma real de saber.
Além disso, espero que muito do seu conteúdo esteja em fita, não em disco (mais barato em volume).
Isso não era netflix, mas eu trabalhei em um site de supercomputador - o armazenamento em disco quando começou a funcionar (1991) era apenas cerca de 90 GB para uso geral (havia mais para o SO, e algumas outras características - mas este era o armazenamento geral para dados).
Que 90 GB eram suportados por dois sistemas de robôs de fita, cada um com cerca de 9.000 fitas, que somavam até 14.400.000 MB (cada fita tinha 800MB). Agora o sistema de arquivos naquele 90GB não guardava todos os dados - mas tinha a estrutura de diretórios e o sistema de arquivos (personalizado) tinha os nomes dos arquivos - mas os metadados para os arquivos indicariam "no disco", e "em fita", e tinham a identificação da localização da fita junto com o local onde ela estava na fita.
Quando o arquivo era acessado e os dados não estavam no disco, o sistema passava a identificação da fita para um controlador de robô que então inseria a fita em um transporte, o sistema posicionava a fita para onde os dados estavam armazenados, e a lia de volta.
Se o arquivo fosse acessado e estivesse em disco a resposta era imediata. Se não estivesse em disco, haveria um atraso enquanto os dados eram copiados da fita.
Então os 90GB só eram usados para armazenar os dados em cache. O atraso normalmente era inferior a 10-15 segundos (unidades de fita rápida, robô rápido). As únicas vezes que as coisas levavam mais tempo era se os transportes de fita (2 em cada sistema robô) já estivessem ocupados ou lendo dados, ou escrevendo novos dados para fazer espaço.
Quando um arquivo estava em disco, e espaço necessário, então o novo arquivo mais antigo seria copiado para fita, e os metadados atualizados para indicar "em fita", e os dados residentes em disco poderiam ser liberados. E isso foi feito para manter uma quantidade mínima de espaço livre em disco.
O sistema de arquivos então parecia que poderia conter cerca de 14.400 GB, ou 14TB.
O tempo que o transporte da fita ficou mais rápido, e as fitas continham mais dados. Quando saí (2003) as fitas continham 2TB cada, e o armazenamento em disco expandiu-se para 30TB (com planos para fitas de 4TB), e havia aproximadamente 400TB de dados no sistema, e estava crescendo a cerca de 1TB por mês.
Então eu espero que o Netflix funcione da mesma forma. Se você começar a ver um filme antigo... e se perguntar por que demora 15-30 segundos para começar - o sistema está copiando os dados de volta da fita e pode estar na fila para outras 10 solicitações....
Gestão de armazenamento hierárquico - Wikipedia