www.mapaserwisu.pl - domena na sprzedaż

Google Sitemap Generator, Mapa serwisu, mapaserwisu, sitemap, generator, skrypt, xml

mapaserwisu, mapaserwisu.pl, mapa serwisu

wiecej info: czijzes@tlen.pl

Portfelo.pl - Twój portfel elektroniczny!


Offline Site Map Generator v2.3

Offline Site Map Generator 2.3 - program do generowania mapy strony internetowej dla wyszukiwarki Google oraz mapy zamieszczanej wewnątrz serwisu internetowego. Mapę tworzymy dla strony, którą mamy na swoim dysku.

Dwa rodzaje map do stworzenia:
- mapa Google w pliku XML,
- zwykła mapa strony w pliku HTML (nazwy linków tworzone są w oparciu o znacznik title z mety strony.

Pliki na podstawie, których ma zostać wygenerowana mapa możemy dobrać w oparciu o różne warunki:
- rozszerzenie plików html, htm, php,
- tworzenie mapy z plików w głównym katalogu lub z podkatalogami,
- po dacie utworzenia, modyfikacji - określamy zakres dat,
- jakie atrybuty mają mieć pliki,
- wielkość plików, zakres,
- jaki tekst mają zawierać pliki, wyszukiwanie plików na podstawie jakiegoś słowa z wnętrza pliku, treści strony.

Program nie instaluje się, należy wypakować do osobnego katalogu i uruchomić.

Źródło: http://legalne.info/soft/1097/Offline-Site-Map-Generator


GSiteCrawler - Sitemap Generator for Windows (v. 1.23)

Program GSiteCrawler jest przeznaczony do robienia tzw. Sitemapów dla wyszukiwarek Google i Yahoo. Program bardzo dokładnie sprawdza stronę i sprawdza każdy link, podczas tworzenia jednego sitemapu potrafi "zjeść" od kilkuset do kilku gb transferu (w zależności od wagi strony i ilości podstron).

Przed wykonaniem pierwszego SiteMapu warto zmienić preferencje programu, bo czas wykonania może nam się wydłużać w nawet dni... :-)

Źródło: http://www.gigadownload.net.pl/index.php/program,861,gsitecrawler-sitemap-generator-for-windows.html


A1 Sitemap Generator 1.4.9

A1 Sitemap Generator pozwala w prosty sposób stworzyć mapę serwisu WWW. Mapy tworzone są w formacie HTML lub XML.

Źródło: http://programy.onet.pl/40,113,11199,,,A1_Sitemap_Generator_1.4.9,programy.html


Build your Site Map online (XML, ROR, Text, HTML)

This website is to let you:

  • Create an XML sitemap format that can be submitted to Google to help them crawl your website better.
  • Create a Text sitemap to submit to Yahoo.
  • Create a ROR sitemap, which is an independant XML format for any search engine.
  • Generate an HTML site map to allow human visitors to easily navigate on your website.

Źródło: http://www.xml-sitemaps.com/


Generator Google Sitemap dla Wordpress

Bardzo przydatny plug-in dla posiadaczy bloga opartego o Wordpress - Google Sitemap Generator for WordPress. Generuje on plik XML - mapę naszej strony akceptowaną przez Google Sitemaps.

Charakterystyka pluginu:

Instalacja jest bardzo prosta. Wystarczy pobrać plik z ze strony autora i wgrać go do wp-content/plugins i w panelu administracji w zakładce Plugins aktywować nasz nowy nabytek :)

Źródło: http://blog.rabinek.pl/2006/08/07/generator-google-sitemap-dla-wordpress/


Google Sitemap Automator 1.7

Program przeznaczony dla administratorów i twórców stron WWW. Za pomocą aplikacji użytkownik może bardzo szybko zindeksować swoją stronę internetową. Dzięki temu Twoi użytkownicy będą szybko odnajdować informacje zawarte na witrynie.

Producent/dystrybutor: Rage Software
Data dodania: 2007-07-26
Rozmiar pliku: 8,52 MB
Nazwa pliku: googlesitemap.dmg
Licencja / cena: Demo
Platforma systemowa: Mac OS X lub nowszy

Pobierz:
http://i.download.idg.pl/fannef/7596f8429e999fb03608bcb9f2e7f305/47c00ebb/software/mac/f-j/googlesitemapautomator/googlesitemap.dmg


Google Sitemap Generator

https://www.google.com/webmasters/tools/docs/pl/sitemap-generator.html

Używanie Google Sitemap Generator

Stworzenie mapy strony oznacza, że nasza strona nie tylko zostanie bardzo szybko zindeksowana przez Google ale zostanie to zrobione ze zdecydowanie większą precyzją, jako że jesteśmy w stanie określić kilka parametrów dzięki którym crawler Google będzie przeszukiwał naszą stronę z np. odpowiednim interwałem czasowym.

Używanie usługi jest stosunkowo prostą sprawą. Jedynym w miarę skomplikowanym zadaniem jest wygenerowanie naszej mapy strony - pliku XML o nazwie sitemap.xml. Na szczęście spora ilość darmowych CMS/BMS doczekała się gotowych pluginów, gdzie instalacja ich jest banalnie prosta. Osobiście użyłem pluginu WordPress-a i na nim będę się opierał. Jeżeli natomiast nie posiadasz systemu do którego został napisany plugin to nic straconego jako, że w sieci jest kilka generatorów map stron.

Dobra. Zakładając, że posiadamy konto na Google i plik sitemap.xml mamy już wygenerowany (w public_html najlepiej) wyglądający mniej/więcej w ten sposób:

<?xml version=1.0 encoding=UTF-8?>
<urlset xmlns=”http://www.google.com/schemas/sitemap/0.84″>
	<url>
		<loc>http://www.adres.pl/</loc>

		<lastmod>2006-01-01</lastmod>
		<changefreq>monthly</changefreq>
		<priority>0.8</priority>
	</url>

</urlset>

Możemy zalogować się na Google Sitemaps i postępować według instrukcji:

  1. Wypełniamy pole z adresem URL naszej strony.
  2. Klikmy na zakładkę Sitemaps, następnie na Add a Sitemap.
  3. Z listy wybieramy Add General Web Sitemap i wypełniamy pole z dokładnym adresem pliku sitemap.xml.

Zrobione. Natomiast jeżeli ktoś chce uzyskać dostęp do odpowiednich statystyk z błędami/logiem crawlera, musi jeszcze zweryfikować swoją stronę:

  1. Klikamy w zakładkę Summary, następnie w link Verify your site.
  2. Mamy dwa sposoby weryfikacji, gdzie polecam sposób z meta-znacznikiem. Generalnie co trzeba zrobić to dodać odpowiedni meta-znacznik (wygenerowany) w nasz szablon.
  3. Po dodaniu znacznika klikamy w przycisk weryfikacji i voila.

W zasadzie już zrobiliśmy to co było do zrobienia z naszej strony. Teraz trzeba czekać aż Google odpowiednio zindeksuje naszą stronę - trwa to ok 24h.

Źródło: http://blog.olicio.us/2006/08/20/uzywanie-google-sitemap/


Do czego służą mapy witryn?

Mapy witryn zapewniają webmasterom prostą metodę informowania wyszukiwarek o dostępnych do zaindeksowania stronach witryn. Mapa witryny w najprostszej postaci to plik XML zawierający listę adresów URL w witrynie oraz dodatkowe informacje o każdym adresie URL (dacie ostatniej aktualizacji, częstotliwości zmian, ważności w porównaniu z innymi adresami URL w tej witrynie). Informacje te umożliwiają wyszukiwarkom inteligentniejsze zaindeksowanie witryny.

Roboty indeksujące zazwyczaj wykrywają strony za pomocą linków znajdujących się w indeksowanej witrynie oraz innych witrynach. Mapy witryn uzupełniają te dane, aby umożliwić robotom indeksującym, które obsługują protokół Sitemap, pobranie wszystkich adresów URL zawartych w mapie witryny i przeanalizowanie powiązanych z nimi metadanych. Użycie protokołu Sitemap nie gwarantuje umieszczenia stron internetowych w indeksach wyszukiwarek, ale znacznie ułatwia indeksowanie witryny robotom.

Skrypt Sitemap 0.90 jest oferowany na warunkach umowy licencyjnej Attribution-ShareAlike Creative Commons License. Jest on ogólnie przyjęty, w tym przez firmy Google, Yahoo! i Microsoft.

Źródło: Sitemaps.org


Format XML mapy witryny

Ten dokument zawiera opis schematu XML protokołu Sitemap.

Format protokołu Sitemap składa się z tagów XML. Wszystkie wartości danych w mapie witryny muszą zawierać kody ucieczki encji. Sam plik musi mieć kodowanie UTF-8.

Mapa witryny musi:

Wszystkie inne tagi są opcjonalne. Niektóre wyszukiwarki mogą nie obsługiwać tych tagów opcjonalnych. Szczegółowe informacje zawiera dokumentacja poszczególnych wyszukiwarek.

Przykład indeksu mapy witryny w formacie XML

Poniżej przedstawiono przykład mapy witryny zawierającej tylko jeden adres URL, w której zastosowano wszystkie tagi opcjonalne. Tagi opcjonalne wskazane są kursywą.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>http://www.example.com/</loc>
      <lastmod>2005-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>
</urlset>

Definicje tagów XML

Dostępne tagi XML przedstawiono poniżej.

Atrybut Opis
<urlset> wymagany

Zawiera plik i odwołanie do bieżącego standardu protokołu.

<url> wymagany

Tag nadrzędny każdego wpisu adresu URL. Pozostałe tagi są elementami podrzędnymi tego tagu.

<loc> wymagany

Adres URL strony. Ten adres URL musi zaczynać się od prefiksu protokołu (na przykład http) i kończyć kreską ułamkową, jeśli wymaga jej Twój serwer internetowy. Ta wartość musi być krótsza niż 2048 znaków.

<lastmod> opcjonalny

Data ostatniej modyfikacji pliku. Ta data powinna mieć format W3C Datetime. Format ten umożliwia pominięcie godziny i podanie samej daty w postaci RRRR-MM-DD.

Należy pamiętać, że ten tag jest niezależny od nagłówka If-Modified-Since (304), który może zwracać serwer, a wyszukiwarki mogą używać informacji z tych dwóch źródeł w odmienny sposób.

<changefreq> opcjonalny

Częstotliwość zmian strony. Ta wartość podaje wyszukiwarkom ogólne informacje i nie może dokładnie korelować częstotliwości indeksowania strony. Prawidłowe wartości to:

  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never

Wartość „always” należy stosować do opisu dokumentów zmieniających się przy każdym otwarciu. Wartość „never” należy stosować do opisu zarchiwizowanych adresów URL.

Należy pamiętać, że wartość tego tagu stanowi wskazówkę, a nie polecenie. Nawet jeśli roboty indeksujące wyszukiwarki uwzględniają te informacje podczas podejmowania decyzji, mogą indeksować strony oznaczone do sprawdzania "hourly" (co godzinę) rzadziej niż co godzinę, a strony oznaczane do sprawdzania "yearly" (co rok) częściej niż co rok. Roboty indeksujące mogą również co pewien czas indeksować strony oznaczone do sprawdzania "never" (nigdy), aby uwzględnić nieoczekiwane zmiany tych stron.

<priority> opcjonalny

Priorytet tego adresu URL w odniesieniu do innych adresów URL w witrynie. Prawidłowy jest zakres wartości od 0.0 do 1.0. Ta wartość nie ma wpływu na porównywanie Twoich stron ze stronami innych witryn. Umożliwia ona jedynie wskazanie wyszukiwarkom, które strony powinny być indeksowane przez roboty w pierwszej kolejności.

Domyślny priorytet strony jest równy 0.5.

Należy pamiętać, że priorytet przypisany stronie nie ma zazwyczaj wpływu na pozycję Twoich adresów URL na stronach wyników wyszukiwania wyszukiwarki. Wyszukiwarki mogą używać tych informacji podczas wybierania adresów URL z tej samej witryny. Ten tag zwiększa prawdopodobieństwo uwzględnienia najważniejszych stron witryny w indeksie wyszukiwarki.

Należy również pamiętać, że przypisanie wysokiego priorytetu wszystkim adresom URL w witrynie raczej w niczym nie pomoże. Priorytet jest względny, czyli jest używany tylko do określania istotności adresów URL w danej witrynie.

Stosowanie kodów ucieczki encji

Plik mapy witryny musi mieć kodowanie UTF-8 (można je zazwyczaj ustawić podczas zapisywania pliku). Tak jak w przypadku wszystkich plików XML, wszelkie wartości danych (włącznie z adresami URL) muszą zawierać kody ucieczki encji znaków podanych w poniższej tabeli.

Znak Kod ucieczki
Znak & & &amp;
Pojedynczy cudzysłów ' &apos;
Podwójny cudzysłów " &quot;
Znak większości > &gt;
Znak mniejszości < &lt;

Ponadto wszystkie adresy URL (włącznie z adresem URL mapy witryny) muszą zawierać kody ucieczki URL i być zakodowane w sposób umożliwiający ich odczytanie przez serwer internetowy, na którym się znajdują. Jeśli jednak do generowania adresów URL używasz jakichkolwiek skryptów, narzędzi lub plików dziennika (czegokolwiek poza ręcznym wpisywaniem), zazwyczaj jest to już wykonane. Należy się upewnić, że wszystkie adresy URL są zgodne ze standardem RFC-3986 dla identyfikatorów URI, standardem RFC-3987 dla identyfikatorów IRI i standardem XML.

Poniżej przedstawiono przykład adresu URL zawierającego znak spoza zestawu ASCII (ü) oraz znak wymagający kodu ucieczki encji (&):

http://www.przyklad.com/ümlat.html&q=name

Poniżej przedstawiono ten sam adres URL w kodowaniu ISO-8859-1 (do celów hostingu na serwerze stosującym to kodowanie) i ze znakami ucieczki:

http://www.przyklad.com/%FCmlat.html&q=name

Poniżej przedstawiono ten sam adres URL w kodowaniu UTF-8 (do celów hostingu na serwerze stosującym to kodowanie) i ze znakami ucieczki:

http://www.example.com/%C3%BCmlat.html&q=name

Poniżej przedstawiono ten sam adres URL, ale z kodami ucieczki encji:

http://www.example.com/%C3%BCmlat.html&amp;q=name

Przykład indeksu mapy witryny w formacie XML

Poniższy przykład przedstawia mapę witryny w formacie XML. Mapa witryny w przykładzie zawiera niewielką liczbę adresów URL, z których każdy zawiera inny zestaw parametrów opcjonalnych.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>http://www.example.com/</loc>
      <lastmod>2005-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>
   <url>
      <loc>http://www.example.com/catalog?item=12&amp;desc=vacation_hawaii</loc>
      <changefreq>weekly</changefreq>
   </url>
   <url>
      <loc>http://www.example.com/catalog?item=73&amp;desc=vacation_new_zealand</loc>
      <lastmod>2004-12-23</lastmod>
      <changefreq>weekly</changefreq>
   </url>
   <url>
      <loc>http://www.example.com/catalog?item=74&amp;desc=vacation_newfoundland</loc>
      <lastmod>2004-12-23T18:00:15+00:00</lastmod>
      <priority>0.3</priority>
   </url>
   <url>
      <loc>http://www.example.com/catalog?item=83&amp;desc=vacation_usa</loc>
      <lastmod>2004-11-23</lastmod>
   </url>
</urlset>

Używanie plików indeksu mapy witryny (w celu grupowania wielu plików map witryn)

Możesz przesłać wiele plików map witryn, ale każdy plik mapy witryny musi zawierać nie więcej niż 50 000 adresów URL i mieć rozmiar nie większy niż 10 MB (10 485 760 bajtów). Jeśli chcesz, możesz skompresować pliki map witryn za pomocą narzędzia gzip, aby utrzymać się w limicie 10 MB i zmniejszyć obciążenie łącza. Jeśli chcesz podać więcej niż 50 000 adresów URL, musisz utworzyć wiele plików map witryn.

W razie zgłaszania wielu map witryn ich listę należy podać w pliku indeksu map witryn. Pliki indeksu map witryn mogą zawierać listę nie więcej niż 1000 map witryn, a ich rozmiar nie może przekraczać 10 MB (10 485 760 bajtów). Format XML pliku indeksu map witryn jest bardzo podobny do formatu XML pliku mapy witryny.

Plik indeksu map witryn musi:

Opcjonalny tag <lastmod> jest również dostępny w przypadku plików indeksu map witryn.

Uwaga! Plik indeksu map witryn może określać jedynie mapy witryn znajdujące się w tej samej witrynie, co plik indeksu map witryn. Na przykład, plik http://www.twojawitryna.com/sitemap_index.xml może zawierać mapy witryn znajdujące się w lokalizacji http://www.twojawitryna.com, ale nie w lokalizacji http://www.przyklad.com lub http://twójhost.twojawitryna.com. Plik indeksu witryn musi mieć, tak jak mapy witryn, kodowanie UTF-8.

Przykład indeksu mapy witryny w formacie XML

Poniższy przykład przedstawia indeks map witryn zawierający dwie mapy witryn:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>http://www.example.com/sitemap1.xml.gz</loc>
      <lastmod>2004-10-01T18:23:17+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>http://www.example.com/sitemap2.xml.gz</loc>
      <lastmod>2005-01-01</lastmod>
   </sitemap>
</sitemapindex>

Uwaga! Adresy URL map witryn, jak wszystkie inne wartości w plikach XML, muszą zawierać kody ucieczki encji.

Definicje tagów XML indeksu mapy witryny

Atrybut Opis
<sitemapindex> wymagany Zawiera informacje dotyczące wszystkich map witryn w pliku.
<sitemap> wymagany Zawiera informacje dotyczące pojedynczej mapy witryny.
<loc> wymagany

Identyfikuje lokalizację mapy witryny.

Ta lokalizacja może być mapą witryny, plikiem Atom, plikiem RSS lub zwykłym plikiem tekstowym.

<lastmod> opcjonalny

Identyfikuje czas modyfikacji odpowiedniego pliku mapy witryny. Nie wskazuje on czasu modyfikacji żadnej ze stron wymienionych w tej mapie witryny. Wartość tagu lastmod powinna mieć format W3C Datetime.

Podając sygnaturę czasową ostatniej modyfikacji, umożliwisz robotom indeksującym wyszukiwarki pobranie tylko podzestawu map witryn z indeksu, czyli robot indeksujący będzie mógł pobrać tylko mapy witryn zmodyfikowane po określonej dacie. Przyrostowy mechanizm pobierania map witryn umożliwia szybkie wykrywanie nowych adresów URL w bardzo dużych witrynach.

Inne formaty mapy witryny

Protokół Sitemap umożliwia podanie wyszukiwarkom szczegółów dotyczących stron. Zachęcamy do jego używania – protokół ten umożliwia podawanie dodatkowych informacji o stronach witryny, a nie tylko ich adresów URL. Oprócz protokołu XML obsługujemy również kanały RSS i pliki tekstowe, za pomocą których można podać nieco bardziej ograniczone informacje.

Kanał dystrybucji danych

Można podać kanał RSS (Real Simple Syndication) 2.0 oraz Atom 0.3 lub 1.0. Tego formatu warto używać tylko jeśli w witrynie jest już stosowany kanał dystrybucyjny. Należy pamiętać, że ta metoda nie zapewnia poinformowania wyszukiwarek o wszystkich adresach URL w witrynie, ponieważ kanał może zawierać jedynie informacje o najnowszych adresach URL. Wyszukiwarki mogą jednak użyć tych informacji do znalezienia innych stron w witrynie podczas normalnego procesu indeksowania, w którym robot indeksujący sprawdza linki na stronach podanych w kanale. Upewnij się, że kanał znajduje się w katalogu na najwyższym poziomie, który mają zaindeksować wyszukiwarki. Wyszukiwarki wyodrębniają informacje z kanału w następujący sposób:

Plik tekstowy

Możesz dostarczyć zwykłe pliki tekstowe zawierające po jednym adresie URL w każdym wierszu. Plik tekstowy musi spełniać następujące wymogi:

Poniżej przedstawiono przykładowe wpisy pliku tekstowego.

http://www.przyklad.com/catalog?item=1
http://www.przyklad.com/catalog?item=11

Lokalizacja pliku mapy witryny

Lokalizacja pliku mapy witryny określa zestaw adresów URL, które można uwzględnić w tej mapie witryny. Plik mapy witryny znajdujący się w lokalizacji http://przyklad.com/catalog/sitemap.xml może zawierać wszelkie adresy URL zaczynające się od http://przyklad.com/catalog/, ale nie może zawierać adresów URL zaczynających się od http://przyklad.com/images/.

Jeśli masz uprawnienie do zmiany ścieżki http://przyklad.org/sciezka/sitemap.gz, to przyjmuje się, że masz również uprawnienie do podania informacji dotyczących adresów URL z prefiksem http://przyklad.org/sciezka/. Przykłady adresów URL uznawanych za poprawne w przypadku adresu http://przyklad.pl/katalog/sitemap.gz obejmują:

http://example.com/catalog/show?item=23  http://example.com/catalog/show?item=233&user=3453  

Przykłady adresów URL uznawanych za niepoprawne w przypadku adresu http://przyklad.com/catalog/sitemap.xml obejmują:

http://example.com/image/show?item=23  http://example.com/image/show?item=233&user=3453
https://example.com/catalog/page1.html

Należy pamiętać, że to oznacza, iż wszystkie adresy URL podane w mapie witryny muszą korzystać z tego samego protokołu (w tym przykładzie http) i znajdować się na tym samym serwerze, co mapa witryny. Jeśli mapa witryny znajduje się na przykład w lokalizacji http://www.przyklad.com/sitemap.xml, nie może ona zawierać adresów URL z lokalizacji http://poddomena.przyklad.com.

Adresy URL uznawane za niepoprawne są odrzucane i nie są już analizowane. Zaleca się umieszczenie mapy witryny w katalogu głównym serwera internetowego. Na przykład, jeśli serwer internetowy znajduje się w domenie przyklad.com, plik indeksu map witryn należy umieścić w lokalizacji http://przyklad.com/sitemap.xml. W niektórych sytuacjach należy wygenerować różne mapy witryn dla różnych ścieżek w witrynie (na przykład, jeśli uprawnienia zabezpieczeń w organizacji dzielą użytkowników na różne kategorie pod względem praw zapisu w różnych katalogach).

W przypadku zgłaszania mapy witryny przy użyciu ścieżki z numerem portu konieczne jest podawanie numeru portu jako części ścieżki w każdym adresie URL znajdującym się w pliku mapy witryny. Na przykład, jeśli mapa witryny znajduje się pod adresem http://www.przyklad.pl:100/sitemap.xml, wszystkie adresy URL zawarte w tej mapie witryny muszą zaczynać się od http://www.przyklad.pl:100.

Sprawdzanie poprawności mapy witryny

Poniższe schematy XML definiują elementy i atrybuty, które może zawierać plik mapy witryny. Możesz pobrać ten schemat, korzystając z poniższych linków:

W przypadku map witryn: http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd
W przypadku plików indeksu map witryn: http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd

Dostępnych jest wiele narzędzi umożliwiających sprawdzenie poprawności struktury mapy witryny opartej na tym schemacie. Listę narzędzi XML można znaleźć w każdej z następujących lokalizacji:

http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html

Aby możliwe było sprawdzenie poprawności pliku mapy witryny lub indeksu mapy witryny przy użyciu schematu, konieczne jest wprowadzenie dodatkowych nagłówków w pliku XML w sposób przedstawiony poniżej.

Mapa witryny:

<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
         http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"
         xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      ...
   </url>
</urlset>

Plik indeksu mapy witryny:

<?xml version='1.0' encoding='UTF-8'?>
<sitemapindex xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
         http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd"
         xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      ...
   </sitemap>
</sitemapindex>

Rozszerzanie protokołu Sitemap

Protokół Sitemap można rozszerzyć za pomocą własnej przestrzeni nazw. Wystarczy określić tę przestrzeń nazw w elemencie głównym. Na przykład:

<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
         http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"
         xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
         xmlns:example="http://www.example.com/schemas/example_schema"> <!-- namespace extension -->
   <url>
      <example:example_tag>
         ...
      </example:example_tag>
      ...
   </url>
</urlset>

Informowanie robotów indeksujących wyszukiwarek

Po utworzeniu pliku mapy witryny i umieszczeniu go na serwerze internetowym należy zgłosić lokalizację pliku wyszukiwarkom obsługującym ten protokół. Dostępne są następujące metody:

Wyszukiwarki mogą wówczas pobrać mapę witryny i udostępnić adresy URL swoim robotom indeksującym.

Zgłaszanie mapy witryny przy użyciu interfejsu zgłaszania wyszukiwarki

Aby zgłosić mapę witryny bezpośrednio do wyszukiwarki (dzięki czemu można będzie otrzymać informacje o stanie i ewentualnych błędach przetwarzania), należy wykonać instrukcje podane w dokumentacji wyszukiwarki.

Określanie lokalizacji mapy witryny w pliku robots.txt

Lokalizację mapy witryny można określić w pliku robots.txt. W tym celu należy dodać następujący wiersz:

Mapa witryny: <lokalizacja_mapy_witryny>

Jako wartość parametru <lokalizacja_mapy_witryny> należy podać pełny adres URL mapy witryny, na przykład: http://www.przyklad.com/sitemap.xml

Ta instrukcja jest niezależna od wiersza user-agent, a zatem można ją umieścić w dowolnym miejscu pliku. Jeśli masz plik indeksu map witryn, możesz podać tylko lokalizację tego pliku. Nie musisz podawać poszczególnych map witryn zawartych w pliku indeksu.

Zgłaszanie mapy witryny przy użyciu żądania HTTP

Aby zgłosić mapę witryny za pomocą żądania HTTP (tag <adres_URL_wyszukiwarki> zastąp adresem URL podanym przez wyszukiwarkę), należy wysłać żądanie na następujący adres URL:

<searchengine_URL>/ping?sitemap=adres_url_mapy_witryny

Jeśli mapa witryny znajduje się w lokalizacji http://www.przyklad.com/sitemap.gz, adres URL będzie mieć postać:

<searchengine_URL>/ping?sitemap=http://www.example.com/sitemap.gz

Zastosuj kodowanie URL do wszystkich znaków za ciągiem /ping?sitemap=:

<searchengine_URL>/ping?sitemap=http%3A%2F%2Fwww.twojawitryna.com%2Fsitemap.gz

Żądanie HTTP można wysłać przy użyciu poleceń wget, curl lub innego żądanego mechanizmu. W razie powodzenia żądania zostanie zwrócony kod 200 protokołu HTTP. Jeśli otrzymasz inną odpowiedź, ponownie wyślij żądanie. Kod 200 protokołu HTTP w odpowiedzi wskazuje jedynie, że wyszukiwarka otrzymała mapę witryny. Nie znaczy to, że mapa witryny lub zawarte w niej adresy URL są prawidłowe. Prosty sposób polega na skonfigurowaniu zautomatyzowanego zadania generowania i zgłaszania map witryn w określonych odstępach czasu.
Uwaga! Jeśli stosujesz plik indeksu map witryn, wyślij jedno żądanie HTTP zawierające lokalizację pliku indeksu map witryn. Nie trzeba wysyłać oddzielnych żądań dla poszczególnych map witryn wskazanych w indeksie.

Wykluczanie treści

Protokół Sitemaps umożliwia informowanie wyszukiwarek o treściach, które powinny zostać zaindeksowane. W celu poinformowania wyszukiwarek, których treści nie powinny indeksować, należy użyć pliku robots.txt lub metatagu robots. Więcej informacji na temat wykluczania treści z wyszukiwarek można znaleźć w witrynie robotstxt.org.

Źródło: Sitemaps.org

FAQ dostępny pod adresem: http://www.sitemaps.org/pl/faq.html



Nowy sposób zgłaszania stron do Google
Opr: Marcin Maj

Firma Google udostępniła webmasterom nowe darmowe narzędzie, dzięki któremu uzyskają większą kontrolę nad informacjami o ich stronach, zawartymi w wyszukiwarce Google i nie tylko.

Google Sitemaps to system (wciąż w wersji beta) umożliwiający bezpośrednią komunikację z wyszukiwarką Google, w celu wymiany pełniejszych informacji o stronach danego webmastera i zaistniałych na nich zmianach.

System umożliwia wskazanie stron, które powinny być przeszukane w pierwszej kolejności. Dzięki Google Sitemaps można także poinformować wyszukiwarkę kiedy dokonano ostatniej zmiany, a nawet zgłosić częstotliwość aktualizacji poszczególnych działów danego serwisu.

Przedstawiciele Google mają nadzieję, że wprowadzenie Google Sitemaps umożliwi wyszukiwarce szybsze i bardziej precyzyjne dotarcie do aktualnych informacji. Skorzystanie z usługi nie gwarantuje wyższej pozycji w wynikach wyszukiwania.

Webmasterzy, jak i osoby korzystające z wyszukiwarki Google powinny jednak z zadowoleniem przyjąć nową usługę. Dzięki niej, nie tylko więcej podstron danego serwisu może zostać szybciej zindeksowanych, ale także wyniki wyszukiwania w Google będą dużo bardziej aktualne.

Aby skorzystać z Google Sitemaps należy zalogować się w serwisie, a następnie przedłożyć opis swojej strony w formacie XML. Można go wygenerować narzędziem o nazwie Sitemap Generator.

Co więcej, Shiva Shivakumar kierownik techniczny Google poinformował na oficjalnym blogu firmy, że Google udostępniło usługę na licencji Creative Commons. Dzięki temu Google Sitemaps, będzie mogło zostać wykorzystane także przez silniki innych wyszukiwarek.

Źródło:


Teraz z Sitemaps korzysta się łatwiej
Opr: Marcin Maj

Webmasterzy korzystający z narzędzia Sitemaps doczekali się wprowadzenia kilku ułatwień, które są pierwszym efektem współpracy największych wyszukiwarek. Teraz umożliwienie robotom wyszukiwarek bardziej efektywnego "szperania" po stronach WWW nie będzie wymagało przedkładania opisu strony wyszukiwarce.

Pierwszą nowością jest udostępnienie strony Sitemaps.org w 18 wersjach językowych, w tym w wersji polskiej. Vanessa Fox napisała na blogu Google, że ten krok ma się przyczynić do wyedukowania webmasterów na całym świecie w kwestii korzystania z Sitemaps.

Kolejną nowością jest ułatwienie korzystania z samego narzędzia, w nowej wersji 0.90. Nie trzeba już przedkładać opisu swojej strony za pomocą udostępnianych przez dostawców wyszukiwarki narzędzi dla webmasterów. Wystarczy dodać do pliku robots.txt jedną linijkę, która informuje o tym gdzie znajduje się plik XML z opisem strony. Linijka może wyglądać tak:
Sitemap: http://www.przyklad.pl/sitemap.xml

Należy pamiętać o podaniu całego URL wraz ze znakami http://.

Co więcej, wyszukiwarka Ask.com (czwarta na świecie) również będzie wspierać Sitemaps. Jest to zresztą korzystne nie tylko dla operatorów stron, ale także dla wyszukiwarki, bo bardziej "inteligentne" indeksowanie stron może pozwolić na dostarczanie lepszych i dokładniejszych wyników wyszukiwania.

Korzystanie z Sitemaps nie ma wpływu na pozycję strony w wyszukiwarce, ale dzięki niemu użytkownicy mogą trafić od razu na właściwą podstronę, bezpośrednio z wyszukiwarki.

Największe wyszukiwarki rozpoczęły wspólną pracę nad Sitemaps w listopadzie ubiegłego roku. Protokół Sitemap pozwala na informowanie wyszukiwarek o adresach URL dostępnych do zindeksowania na danej stronie, a korzystająca z niego mapa witryny to plik XML zawierający listę adresów. Sitemap umożliwia też podanie dodatkowych informacji o każdym adresie, co owocuje "inteligentniejszym" zindeksowaniem witryny.

Źródło:


Yahoo i Microsoft będą wspierać Sitemaps
Opr: Marcin Maj

Trzy wielkie firmy (Google, Yahoo! i Microsoft) prowadzące swoje wyszukiwarki ogłosiły, że będą wspólnie wspierać rozwój protokołu Sitemaps. Udostępnione ponad rok temu przez Google narzędzie Sitemaps skierowane jest do webmasterów - ułatwia robotom wyszukiwarek bardziej efektywne "szperanie" po stronach WWW oraz indeksowanie ich treści w wyszukiwarkach - ale zyskują także na tym sami użytkownicy wyszukiwarek.

Protokół Sitemap pozwala na informowanie wyszukiwarek o adresach URL dostępnych do zindeksowania na danej stronie. Korzystająca z niego mapa witryny to plik XML zawierający listę adresów. Sitemap umożliwia też podanie dodatkowych informacji o każdym adresie, co owocuje "inteligentniejszym" zindeksowaniem witryny.

Korzystanie z Sitemaps nie ma wpływu na pozycję strony w wyszukiwarce, ale dzięki niemu użytkownicy mogą trafić od razu na właściwą podstronę, bezpośrednio z wyszukiwarki.

Na mocy ogłoszonego teraz porozumienia pomiędzy największymi wyszukiwarkami, Google, Yahoo i Microsoft będą wspólnie pracować nad protokołem Sitemaps i będą publikować wprowadzone do niego ulepszenia na stronie www.sitemaps.org.

Przez niektórych komentatorów wspólne wsparcie Sitemaps jest nazywane krokiem milowym w rozwoju wyszukiwarek. Operatorzy witryn wreszcie zyskają uniwersalne narzędzie, które pozwoli im dostarczać informacje o stronie. Zyskają na tym również inni użytkownicy internetu, bo mogą oni liczyć na to, że wyniki wyszukiwania będą bardziej adekwatne do tego, co chcą znaleźć.

Źródło:


www.portfelo.pl - banki, bank, kredyt, kredyty, pozyczki, lokaty, ike, konto, konta, leasing, factoring, private banking, przelewy24, przelew, online, produkcja, przelewy, polcard, inteligo, mbank, hipoteka, hipoteczny www.himpage.pl | www.forum.himpage.pl | www.ogrodki.eu | www.mapaserwisu.pl | www.portfelo.pl | www.lepszeprogramy.pl | www.kryzys-ekonomiczny.pl | www.kryzys-gospodarczy.pl