Gigablast

  • Free $
  • Web
  • Self-Hosted

Gigablast è un motore di ricerca potente, opensource, nuovo che esegue l'indicizzazione in tempo reale!

Funzioni

Scalabile a migliaia di server .
È stato ridimensionato a oltre 12 miliardi di pagine Web su oltre 200 server.
Un doppio quad core, con 32 GB di ram e due SSD Intel da 160 GB, con 8 istanze Gigablast, può fare circa 8 qps (query al secondo) su un indice di 10 milioni di pagine. Le unità saranno vicine alla capacità massima di archiviazione. La dimensione dell'indice di raddoppio ridurrà più o meno la velocità di dimezzamento. (Le metriche sul rendimento possono essere fatte circa dieci volte più velocemente ma non ho ancora capito. L'utilizzo dello spazio su disco rimarrà probabilmente lo stesso perché è già abbastanza efficiente.) 1 milione di pagine web richiede 28,6 GB di spazio su disco . Ciò include l'indice, le meta informazioni e l'HTML compresso di tutte le pagine Web.
La velocità di ragno è di circa 1 pagina al secondo per core. Quindi un doppio quad core può spider e indicizzare 8 pagine al secondo, ovvero 691.200 pagine al giorno.
Richiede 4 GB di RAM per istanza Gigablast. (instance = process)
Demo live su http://www.gigablast.com/
Scritto in C / C ++ per prestazioni ottimali.
Oltre 500.000 righe di C / C ++.
100% personalizzato . Un singolo binario. Il server web, il database e tutto il resto sono tutti contenuti in questo codice sorgente in modo estremamente efficiente. Rende più semplice l'amministrazione e la risoluzione dei problemi.
Affidabile. È stato testato in produzione dal vivo dal 2002 su miliardi di query su un indice di oltre 12 miliardi di pagine web uniche, 24 miliardi speculari.
Super veloce ed efficiente. Uno dei pochi motori di ricerca che hanno raggiunto numeri così grandi. L'unico motore di ricerca open source che ha.
Supporta tutte le lingue. Può dare risultati nelle lingue specificate una spinta sugli altri al momento della query. Utilizza internamente la rappresentazione UTF-8.
Registrare la traccia. È stato usato da molti clienti È stato utilizzato con successo nel software aziendale distribuito.
Pagine Web memorizzate nella cache con evidenziazione del termine della query ....

Categoria

Applicazioni per la gestione dei contatti