otrdiena, 2011. gada 10. maijs

Websvārki



Es esmu Kristaps Kūlis un es esmu sācis veidot projektu ar nosaukumu WebSvārki. Pašlaik esmu izanalizējis 12960 .lv domēnu datus. Par katru domēnu man ir A un MX DNS ieraksti, pirmās lapas HTTP headeri un informācija par HTTPS sertifikātu izdevējiem.

Diemžēl, 12 960 domēnu ir par maz, lai veiktu objektīvus secinājumus par Latvijas interneta tehnisko stāvokli. Pagājuši ir tie laiki, kad varēji vienkārši iegūt pilnu .lv. un gov.lv. zonu.

Ar apmaksātiem reklāmrakstiem, pompozām no reālas situācijas distancētām "drošības" organizācijām mēs nepanāksim drošāku Latvijas interneta vidi. Tas, ko es gribu panākt ir objektīvi dati - par to kādas tehnoloģijas un kādos apjomos tiek reāli izmantotas Latvijas interneta vidē.

Ja kādam hakerim, urķim vai vienkārši interneta aktīvistam ir vēlme padalīties ar .lv domēna vārdu sarakstu, tad to var darīt izmantojot websvarki.lv formu vai sūtot BlackHalt (blackhalt@gmail.com), kas man tos tālāk nodos man.

Projekts šobrīd ir nekomerciāls, bez tizlas vēlmes par katru cenu nopelnīt. Nekādu affiliate un adSense linku nav un nebūs.

Lai nomierinātu tos, kas saka, ka projekts drīz tāpat nomirs, es apsolu, kad gadījumā, ja es zaudēšu interesi vai iespējas šo projektu uzturēt, es aktuālo datu un programmatūras versiju (šobrīd tur ir Django ietvarā rakstīta web aplikācija un python rakstīti datu iegūšanas servisi) ievietošu GitHub, programmatūru zem BSD licences, bet datus zem Creative Common Non-Commercial Attribution licences.

Nobeigumā pāris secinājumi no jau iegūtajiem datiem:
  • 82% Latvijas tīmekļa darbojas uz atvērtā koda tehnoloģijām (Linux, BSD)
  • 94% no dinamiskām web lapām izmanto PHP.
  • 11% no PHP lapām vēljoprojām darbojas uz aizvēsturiskā PHP4
  • Nano.Lv, Datateks.lv un SigmaNet ir lielākie web hostinga pakalpojumu sniedzēji Latvijā
  • DEAC, SigmaNet un Nano.lv ir lielākie datu centra pakalpojumu sniedzēji Latvijā
  • ceturtā daļa no Latvijas e-pastiem stāv pie Google, Google Apps pakalpojumā.
  • puse no HTTPS izmantotājiem izmanto pašparakstītus sertifikātus.
55096709492717636125856884745785464775

9 komentāri:

  1. var maukt adreses iekš http://smart-ip.net/en/tools/ip-domains

    AtbildētDzēst
  2. Error! Try to enter another IP address or hostname.

    AtbildētDzēst
  3. izstaas ka nav njemts veeraa ka dns vareetu atgriezt vairaak kaa vienu ip

    AtbildētDzēst
  4. "Pieņemot, ka hostinga pakalpojumu nodrošinātāji seko labās prakses tradīcijām no IP adreses reverse DNS ieraksta var iegūt informāciju par pakalpojumu sniedzēju.."

    Interesanta labā prakse? No kurienes dabūts, ka tā ir labā prakse? Daudz precīzāku info var iegūt ar whois vai arī no LV IP adrešu saraksta.

    AtbildētDzēst
  5. whois dati nav regulārā formātā un neparsējas normāli.

    pie tam, no whois un lv ip adrešu saraksta var iegūt datu centru, nevis hosteri, as kaudze mazo hosteru serverus tur kaut vai DEAC un pēc šādas metodes DEAC sanāktu viens no lielākajiem webhostinga kantoriem :-)

    Principā MX valīdi DNS ieraksti ir must have un paskatoties pasaules un Latvijas hosterus - reversie DNS tiek uzlikti uz kantora nosaukumu :-)

    AtbildētDzēst
  6. Jā, taisnība.

    Par MX un rev must have jau es neko nesaku. Vairāk par to, ka tam jābūt kompānijas vārdā.

    Un whois dati ļoti labi parsējas :)

    AtbildētDzēst
  7. Btw, no kurienes tie 12k+ lv domēnu? No googles?

    AtbildētDzēst
  8. Nu aplūrot datus - vairums tā dara :) Rev liek kompānijas vārdā.

    no public directory. No googles ir mazāk par 1k (minēt captchu uz 20 domēniem - not cool.

    un pēc maniem eksperimentiem - gala allokēto orgarnizāciju noteikt ir dīvaini, it sevišķi ja daļa ir aizdīķa un izmantojas nevis RIPE.NET whois, bet ARIN :)

    AtbildētDzēst
  9. projekts jau izbeidzies? nedarbojas vairāk.

    AtbildētDzēst

Jūsu komentārs tiks nosūtīts mājas lapas administratoram, līdz apstiprināšanai tas var nebūt pieejams šī bloga publiskajā daļā.