Quantos megabytes há em um livro?
Esta pergunta é quase impossível de responder; está na linha de 'quanto tempo é um pedaço de corda?' No entanto vou tentar...
Comecemos com comprimentos típicos de palavras para diferentes formas de história. Segundo Isaac Asimov (em sua introdução à sua coleção Short Science Fiction Novels, Robinson, Reino Unido 1986) um 'conto' é tipicamente no comprimento de 5000-7000 palavras, um novelette é 10,000-20,000 palavras, uma novela é 30,000-50,000, e um romance é 70,000 palavras e acima.
Em inglês, há uma média de seis caracteres por palavra incluindo espaços.
Em ACSII de 8 bits ou Unicode básico há oito bits (um byte) por personagem. Vamos ignorar a habilidade do Unicode de usar até quatro bytes por caractere.
Para este exercício vamos assumir um romance de 70k palavras. Isso faz 420.000 caracteres, em média, o que significa 420.000 bytes. Existem 1024 bytes em um kilobyte e 1024 kilobytes em um megabyte, então um romance de 70k palavras SEM FORMATO levaria uma pequena fração a mais de 0.4MB.
O formato EPUB para ebooks é baseado em HTML; ele usa códigos HTML para etiquetar o conteúdo para que os leitores eletrônicos possam reconhecer diferentes elementos (títulos de capítulos, corpo de texto, citações, legendas, etc.) e exibi-los da maneira apropriada. Um arquivo EPUB típico não terá mais que 5% de seu conteúdo de texto bruto como tags, então vamos adicionar 5% à suposição de 70k palavras:
- Words: 73,500
- Caracteres: 441.000
- Li>Tamanho: 0,42MB
(Tecnicamente falando, se uma imagem vale literalmente mil palavras, os passos acima mostram que 1000 palavras = 6000 caracteres = aproximadamente uma imagem em escala de cinza 32x32px. Mas isso é uma resposta para uma pergunta diferente. ? )