TI/Internet pasywnie: Różnice pomiędzy wersjami
Linia 40: | Linia 40: | ||
W tym przypadku /~durka to standardowe oznaczenie katalogu domowego (''home directory'') użytkownika durka — konkretnie części tego katalogu, zawierającej pliki dostępne przez WWW. Znajduje się w nim plik infor.html, dostępny przez usługę http, czyli Hypertext Transfer Protocol — służący do pobierania dokumentów hipertekstowych jakimi są zasoby WWW. | W tym przypadku /~durka to standardowe oznaczenie katalogu domowego (''home directory'') użytkownika durka — konkretnie części tego katalogu, zawierającej pliki dostępne przez WWW. Znajduje się w nim plik infor.html, dostępny przez usługę http, czyli Hypertext Transfer Protocol — służący do pobierania dokumentów hipertekstowych jakimi są zasoby WWW. | ||
+ | |||
+ | <!-- | ||
Dokładną definicję protokoły HTTP można przeczytać w dokumencie RFC 2616. | Dokładną definicję protokoły HTTP można przeczytać w dokumencie RFC 2616. | ||
Linia 49: | Linia 51: | ||
====URL c.d.==== | ====URL c.d.==== | ||
− | + | --> | |
Większość przeglądarek akceptuje niekompletne URL, nie wymagając | Większość przeglądarek akceptuje niekompletne URL, nie wymagając | ||
podania przedrostka http://. | podania przedrostka http://. |
Wersja z 10:05, 19 lip 2024
TI/WWW
Jedną z podstawowych funkcji internetu jest funkcja informacyjna. Dostęp do niej mamy poprzez WWW — World Wide Web. Jak większość rzeczy w informatyce, początki WWW wywodzą się ze środowiska fizyków. We wczesnych latach 90-tych w CERN zbudowano (konkretnie zrobił to Tim Bernes-Lee) na potrzeby wewnętrzne prototyp systemu informacyjnego umożliwiającego wygodny dostęp do różnorodnych danych tej organizacji. I po kilku latach używał tego cały świat.
Wskazywanie zasobów WWW
World Wide Web składa się ze stron internetowych — hipertekstów, w których możemy wędrować po hiperłączach. Tylko skąd właściwie wiadomo jak wskazywać konkretne witryny internetowe?
Z pomocą przychodzi nam URL — Uniform Resource Locator, sposób identyfikacji zasobów dostępnych w internecie, NIE tylko stron WWW!
URL
Uniform Resource Locator, czyli Uniwersalny Lokalizator Zasobów, to globalnie jednoznaczna identyfikacja pliku (lub usługi) i sposobu dostępu. Najczęściej spotykamy się z adresami URL wpisywanymi w przeglądarce. Przyjrzyjmy się jak wygląda standardowy adres wpisywany w pole przeglądarki:
Można go podzielić na dwie części: "http://" specyfikuje nam protokół zgodnie z jakim program, jakim jest przeglądarka internetowa, ma pobierać dane, "www.fuw.edu.pl" to adres serwera na którym pobierany zasób się znajduje.
Czyli w ogólności, URL składa się, kolejno od lewej, z:
- rodzaju usługi/zasobu (np.FTP, HTTP, HTTPS)
- adresu komputera — serwera na którym zasób jest dostępny (IP lub symbolicznego)
- ścieżki dostępu do pliku
Na przykład ftp://brain.fuw.edu.pl/pub/plik.txt oznacza, że plik o nazwie plik.txt (rozszerzenie .txt sugeruje tekst ASCII) znajduje się w katalogu /pub komputera brain.fuw.edu.pl i jest dostępny za pośrednictwem usługi ftp. Ftp to file transfer protocol, czyli protokół transferu plików. Dostęp do tego pliku (oczywiście przez Internet) możemy uzyskać za pomocą specjalnego programu-klienta ftp, ale jak w przypadku większości usług wystarczy też po prostu wpisać URL w polu przeglądarki, w którym wpisujemy adresy stron WWW.
Inny przykład URL to http://brain.fuw.edu.pl/~durka/infor.html.
W tym przypadku /~durka to standardowe oznaczenie katalogu domowego (home directory) użytkownika durka — konkretnie części tego katalogu, zawierającej pliki dostępne przez WWW. Znajduje się w nim plik infor.html, dostępny przez usługę http, czyli Hypertext Transfer Protocol — służący do pobierania dokumentów hipertekstowych jakimi są zasoby WWW.
Większość przeglądarek akceptuje niekompletne URL, nie wymagając podania przedrostka http://.
Dalej występuje nazwa komputera, składająca się z kilku nazw oddzielonych kropkami. W pełnej nazwie komputera powinny występować, kolejno od prawej:
- symbol kraju: pl, de, uk itd. — nie dotyczy USA,
- rodzaj instytucji: com — firma, edu — uczelnia, gov — rządowa itd.,
- nazwa instytucji,
- nazwa komputera (często www)
Na przykład czytany od prawej adres www.fuw.edu.pl mówi nam, że komputer znajduje się w Polsce (pl), należy do uczelni (edu) określającej się jako fuw (Fizyka, Uniwersytet Warszawski), wreszcie jest serwerem WWW.
HTML: język WWW
Materiały do samodzielnej nauki składni HTML można łatwo znaleźć w Internecie, np. http://www.w3schools.com/html/
Podstawowa struktura dokumentu HTML:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html lang="pl">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>Tytuł strony</title>
</head>
<body>
Treść strony.
</body>
</html>