pirmdiena, 2010. gada 2. augusts

Lejupielādēti un sistematizēti ~100 miljons Facebook lietotāju datu

Kāds Ron Bowes lejupielādējis, sistematizējis un publiskojis Facebook publiskās daļas ievērojamu daudzumu lietotāju datus.
Ja nekļūdos, tad savākti ir tikai tie lietotāju dati, kuru saturēja tikai latīņu burtus.


An additional limitation is that these are only users whose first characters are from the latin charset. I plan to add non-Latin names in future releases.


Lejupielādētie dati tika saarhivēti bz2 datņu formātos un publicēti izmantojot BitTorrent.

Lejupielādējot 2.79 GiB datņu kopu, jebkurš iegūst šādas datnes:

Filename                        Description
-------------------------------------------------------------------------
facebook.rb The script used to generate these files (v1)
facebook.nse The script that will be used for the second pass (v2)
facebook-urls The full URLs to every profile
facebook-names-original All names, including duplicates
facebook-names-unique All names, no duplicates
facebook-names-withcount All names, no duplicates but with a count
facebook-firstnames-withcount All first names (with count)
facebook-lastnames-withcount All last names (with count)
facebook-f.last-withcount All first initial last name (with count)
facebook-first.l-withcount All first name last initial (with count)


Manuprāt, interesantākie ir facebook-urls (URL no izmantotajiem lietotājiem) un visi vārdi un uzvārdi.

No šīm datnēm var izveidot svaigu un aktuālu (!) vārdnīcu (wordlist) - paroļu, hash utml piemeklēšanai.

Jāpiezīmē, ka atarhivējot kādu no bz2 datnēm, to izmērs var sasniegt vairākus GiB tīra teksta, piemēram, facebook-urls.txt.bz2 ~1.3 GiB būs ~9.7 GiB.
Datņu atvēršanai jāizmanto tādas programmas, kas spēj tādu datu apjomu atvērt pakāpeniski.




Saite uz torrent datni: Facebook directory - personal details for 100 million users (download torrent) - TPB
Saite uz Ron Bowes bloga ierakstu: SkullSecurity » Blog Archive » Return of the Facebook Snatchers.


P.S. Kurš pirmais publicēs analoģiskus datus par draugiem.lv?
55096709492717636122331899517632591845

3 komentāri:

  1. Un ko ar to visu plāno darīt ??? Bik nesapratu vai viņi ir nospēruši datus vai hakeri vai kas?

    AtbildētDzēst
  2. nav nozagti dati, vienkārši ielādētas visas saites kas pieejamas facebook profilu direktorijā ar tajā esošajiem datiem.

    priekš kam tos wordlistus, obligāti visiem kaut kas ir jāuzlauž, nevar dzīvot normāli?

    AtbildētDzēst
  3. Skatoties uz failiņu sarakstu, atmiņā attaust mans skripts, ko rakstīju priekš viena džeka, kuram vajadzēja saskrāpēt kopā lielvards.lv terminu vārdnīcas datus. Es arī vispirms sakasīju kopā visus linkus, ieglabāju .txt failā un tad apstaigāju šos linkus, savācot nepieciešamos datus.
    Ja nebūtu, ko darīt, tad nebūtu grūti uzrakstīt skriptu, kas salasa kopā info no draugiem.lv publiskajām lapām.

    AtbildētDzēst

Jūsu komentārs tiks nosūtīts mājas lapas administratoram, līdz apstiprināšanai tas var nebūt pieejams šī bloga publiskajā daļā.