ਇੰਟਰਨੈੱਟ ', ਬਲੌਗ
ਗੂਗਲ ਨੂੰ ਇੰਡੈਕਸ ਤੱਕ ਇੱਕ ਸਾਈਟ ਜ ਇਸ ਦੇ ਟੁਕੜੇ ਨੂੰ ਹਟਾਉਣ ਲਈ
ਇੰਡੈਕਸਿੰਗ ਸੰਕਲਪ ਗੂਗਲ ਨੇ ਅਪਣਾਇਆ ਅਨੁਸਾਰ,, ਸੰਪੂਰਨਤਾ ਲਈ ਗਿਣਿਆ ਜਾਣਕਾਰੀ ਅਤੇ ਨਤੀਜੇ ਜਾਰੀ ਕਰਨ ਵਿੱਚ ਖੋਜ ਪੁੱਛਗਿੱਛ ਕਰਨ ਲਈ ਇਸ ਦੇ ਅਨੁਸਾਰ ਦੇ ਨਿਰਪੱਖਤਾ. ਇੰਡੈਕਸ ਦੀ ਗੈਰ-ਕਾਨੂੰਨੀ ਸਮੱਗਰੀ ਨੂੰ, ਜ ਸਪੈਮ ਲਈ ਸਰੋਤ ਦੇ ਨਾਲ ਦੀ ਵੈੱਬਸਾਈਟ ਡਿੱਗ ਹੋ, ਇਸ ਸਾਈਟ ਦੇ ਸਫ਼ੇ ਆਮ ਡਾਟਾਬੇਸ ਖੋਜ ਇੰਜਣ ਵਿੱਚ ਨਿਸ਼ਾਨਬੱਧ ਕੀਤਾ ਹੈ, ਨਾ ਹੋਵੇਗਾ. ਸਾਨੂੰ ਕਰਨ ਲਈ ਇਸ ਨੂੰ ਸਿੱਖਣ ਲਈ ਜ਼ਰੂਰੀ ਹੈ ਕਿ ਇੱਕ ਸਾਈਟ ਨੂੰ ਹਟਾਉਣ ਲਈ ਖੋਜ ਸਰਵਰ ਦੇ ਨਤੀਜੇ ਜਾਰੀ ਹੈ.
ਜ਼ੀਰੋ ਇੰਡੈਕਸਿੰਗ ਗੂਗਲ ਦੇ ਰੂਪ
ਇੱਕ ਵਾਰ ਖੋਜ ਰੋਬੋਟ - ਨਵ ਸਰੋਤ ਬਾਰੇ ਜਾਣਕਾਰੀ ਨੂੰ ਇਕੱਠਾ ਕਰਨ ਲਈ ਇੱਕ ਪ੍ਰੋਗਰਾਮ - ਸਫ਼ਾ ਕੇ ਸਾਈਟ ਸਫ਼ਾ ਸਕੈਨ ਹੋਵੇਗਾ, ਫਿਰ, ਪਾਰਸ ਲਈ Google ਨੀਤੀ ਲੋੜ ਦੇ ਅਧੀਨ ਹੈ, ਇਸ ਨੂੰ ਤਤਕਰਾ ਕੀਤਾ ਜਾਵੇਗਾ, ਜਦ. ਪਰ ਸਾਨੂੰ ਇਹ ਵੀ ਤੁਹਾਨੂੰ ਦਿਖਾ ਹੈ ਕਿ ਇਕ Robots.txt ਦੁਆਰਾ ਖੋਜ ਇੰਜਣ ਦੇ ਲਈ ਆਪਣੇ ਸਾਈਟ ਟੁਕੜੇ ਨੂੰ ਹਟਾਉਣ ਲਈ - ਇੰਡੈਕਸ ਅਤੇ ਉਸੇ ਵੇਲੇ 'ਸਟਾਪ' ਤੇ ਖੋਜ ਕਰ.
ਇੱਕ ਮੁਕੰਮਲ ਸਰੋਤ ਜਾਰੀ ਵੱਖ ਕਰਨ ਲਈ, ਸਰਵਰ, ਜਿਸ 'ਤੇ ਸਾਈਟ ਸਥਿਤ ਹੈ ਦੇ ਰੂਟ ਫੋਲਡਰ ਵਿੱਚ, ਇੱਕ ਖਾਸ ਟੈਕਸਟ ਖੇਤਰ ਬਣਾਉਦਾ ਹੈ - Robots.txt ਹੈ. ਇਹ ਜ਼ੋਨ ਨਿਰਦੇਸ਼ ਨੂੰ ਪੜ੍ਹਨ ਲਈ ਦੇ ਅਨੁਸਾਰ ਖੋਜ ਇੰਜਣ ਨਾਲ ਇਲਾਜ ਕੀਤਾ ਅਤੇ ਕੰਮ ਕਰ ਰਿਹਾ ਹੈ.
ਧਿਆਨ ਵਿੱਚ ਰੱਖੋ, ਜੋ ਕਿ ਗੂਗਲ ਖੋਜ ਇੰਜਣ ਇੰਡੈਕਸ ਸਫ਼ਾ, ਇੱਕ ਉਪਭੋਗੀ ਪਹੁੰਚ ਹੈ, ਵੀ, ਜੇ ਤੇ ਪਾਬੰਦੀ ਨੂੰ ਵੇਖਣ ਲਈ. ਬਰਾਊਜ਼ਰ ਨੂੰ 401 ਜ 403 ਦੇ ਨਾਲ ਜਵਾਬ ਜਦ "ਪਹੁੰਚ ਗਲਤ ਹੈ", ਇਸ ਨੂੰ ਸਿਰਫ ਸੈਲਾਨੀ ਦੀ ਬਜਾਇ ਪ੍ਰੋਗਰਾਮ ਹੈ, ਜੋ ਕਿ ਇਸ ਦੇ ਲਈ ਇਕੱਠਾ ਵੱਧ ਲਾਗੂ ਹੁੰਦਾ ਹੈ, ਖੋਜ ਇੰਜਣ.
ਇਹ ਸਮਝਣ ਲਈ ਕਿ ਹਟਾਉਣ ਲਈ ਕਿਸ ਖੋਜ ਇੰਜਣ ਇੰਡੈਕਸਿੰਗ ਤੱਕ ਸਾਈਟ, ਇੱਕ ਪਾਠ ਸੰਕੇਤਕ ਹੇਠ ਲਾਈਨ ਦਰਜ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ:
ਯੂਜ਼ਰ-ਏਜੰਟ: Googlebot
ਅਸਵੀਕਾਰ: /
ਇਹ crawler ਦਾ ਸੂਚਕ ਅੰਕ ਸਾਈਟ 'ਤੇ ਸਾਰੀ ਸਮੱਗਰੀ ਦੀ ਪਾਬੰਦੀ ਦੱਸਦਾ ਹੈ. ਇੱਥੇ ਇੱਕ ਸਾਈਟ ਨੂੰ ਹਟਾਉਣ ਲਈ ਗੂਗਲ, ਇਸ ਲਈ ਹੈ ਕਿ ਆਉਣ ਵਾਲੇ ਸੂਚੀ ਵਿੱਚ ਸਰੋਤ ਨੂੰ ਕੈਸ਼ ਨਹੀ ਹੈ ਖੋਜਿਆ ਹੈ.
ਵੱਖ-ਵੱਖ ਪਰੋਟੋਕਾਲ ਲਈ ਸਕੈਨਿੰਗ ਦੇ Embodiments
ਜੇਕਰ ਤੁਹਾਨੂੰ ਹਾਇਪਰਟੈਕਸਟ ਲਈ ਵਿਅਕਤੀਗਤ ਸੰਚਾਰ ਮਿਆਰ, ਜਿਸ ਦੇ ਲਈ ਤੁਹਾਨੂੰ ਗੂਗਲ ਇੰਡੈਕਸਿੰਗ, ਉਦਾਹਰਨ ਲਈ ਲਈ ਵਿਸ਼ੇਸ਼ ਨਿਯਮ ਨੂੰ ਲਾਗੂ ਕਰਨਾ ਚਾਹੁੰਦੇ ਦੀ ਸੂਚੀ ਹੈ, ਨੂੰ ਵੱਖਰੇ ਚਾਹੀਦਾ ਹੈ ਪ੍ਰੋਟੋਕਾਲ HTTP / HTTPS, ਇਸ ਨੂੰ ਇਹ ਵੀ ਹੇਠ ਤਰੀਕੇ ਨਾਲ (ਉਦਾਹਰਨ) ਵਿਚ Robots.txt ਵਿਚ ਰਜਿਸਟਰ ਕਰਨ ਲਈ ਜ਼ਰੂਰੀ ਹੈ.
(Http://yourserver.com/robots.txt) - ਆਪਣੀ ਸਾਈਟ ਦੀ ਇੱਕ ਡੋਮੇਨ ਨਾਮ (ਕਿਸੇ)
ਯੂਜ਼ਰ-ਏਜੰਟ: * - ਕਿਸੇ ਵੀ ਖੋਜ ਇੰਜਣ
ਦੀ ਇਜ਼ਾਜਤ: / - ਪੂਰੀ ਇੰਡੈਕਸੇਸ਼ਨ ਦੀ ਇਜਾਜ਼ਤ
ਇਸ ਮੁੱਦੇ ਨੂੰ ਪੂਰੀ HTTPS ਪਰੋਟੋਕਾਲ ਲਈ ਇੱਕ ਸਾਈਟ ਨੂੰ ਹਟਾਉਣ ਲਈ ਕਰਨਾ ਹੈ
(Https://yourserver.com/robots.txt):
ਯੂਜ਼ਰ-ਏਜੰਟ: *
ਅਸਵੀਕਾਰ: ਇੰਡੈਕਸਿੰਗ ਤੇ / ਮੁਕੰਮਲ ਪਾਬੰਦੀ
ਗੂਗਲ ਅਰਨਿੰਗਜ਼ ਤੱਕ ਤੇਜ਼ੀ ਹਟਾਉਣ URL- ਸਰੋਤ ਐਡਰੈੱਸ
ਤੁਹਾਨੂੰ ਮੁੜ-ਇੰਡੈਕਸੇਸ਼ਨ ਲਈ ਉਡੀਕ ਨਾ ਕਰਨਾ ਚਾਹੁੰਦੇ, ਹੈ ਅਤੇ ਸਾਈਟ 'ਤੁਹਾਡੇ ਵਰਗੇ ਓਹਲੇ ਕਰਨ ਲਈ ਚਾਹੁੰਦੇ ਹੋ, ਮੈਨੂੰ ਸੰਭਵ ਤੌਰ' ਤੇ ਛੇਤੀ ਹੀ ਸੇਵਾ http://services.google.com/urlconsole/controller ਨੂੰ ਵਰਤਣ ਲਈ ਦੀ ਸਿਫਾਰਸ਼. ਪ੍ਰੀ Robots.txt ਸਾਈਟ ਸਰਵਰ ਦੇ ਰੂਟ ਡਾਇਰੈਕਟਰੀ ਵਿੱਚ ਰੱਖਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ. ਇਹ ਉਚਿਤ ਨਿਰਦੇਸ਼ ਤਜਵੀਜ਼ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ.
ਕੁਝ ਕਾਰਨ ਕਰਕੇ ਸੰਕੇਤਕ ਰੂਟ ਡਾਇਰੈਕਟਰੀ ਵਿੱਚ ਹੀ ਸੋਧਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਜੇ, ਟਾਰਗਿਟ, ਜਿਸ ਦੇ ਲਈ ਤੁਹਾਨੂੰ ਖੋਜ ਇੰਜਣ ਤੱਕ ਓਹਲੇ ਕਰਨ ਲਈ ਚਾਹੁੰਦੇ ਹੋ ਦੇ ਨਾਲ ਫੋਲਡਰ ਵਿੱਚ ਕਾਫ਼ੀ ਇਸ ਨੂੰ ਬਣਾਉਣ. ਇੱਕ ਵਾਰ ਤੁਹਾਨੂੰ ਸੇਵਾ ਕਰਨ ਲਈ ਇਸ ਨੂੰ ਕਰਦੇ ਹਨ ਅਤੇ ਵੇਖੋ ਨੂੰ ਆਪਣੇ ਆਪ ਹੀ ਹਾਇਪਰਟੈਕਸਟ ਪਤੇ ਨੂੰ ਹਟਾਉਣ ਲਈ, Google ਫੋਲਡਰ, ਜੋ ਕਿ Robots.txt ਵਿੱਚ ਇੱਕ ਫਲਾਅ ਅਸੂਲਾ ਸਕੈਨ ਨਾ ਕਰੇਗਾ.
ਇਸ invisibility ਦੀ ਮਿਆਦ 3 ਮਹੀਨੇ ਲਈ ਸੈੱਟ ਕੀਤਾ ਗਿਆ ਹੈ. ਇਸ ਮਿਆਦ ਦੇ ਬਾਅਦ, ਡਾਇਰੈਕਟਰੀ ਮੁੱਦੇ 'ਤੱਕ ਵਾਪਸ, ਨੂੰ ਫਿਰ ਗੂਗਲ ਸਰਵਰ ਦੁਆਰਾ ਕਾਰਵਾਈ ਕੀਤੀ ਜਾਵੇਗੀ.
H ਦੇ ਉ.ਡਬਲਿਯੂ ਅੰਸ਼ਕ ਨੂੰ ਸਕੈਨ ਕਰਨ ਲਈ ਇੱਕ ਸਾਈਟ ਨੂੰ ਹਟਾਉਣ ਲਈ
ਜਦ ਇੱਕ ਖੋਜ ਬੋਟ Robots.txt ਦੇ ਭਾਗ ਪੜ੍ਹਨ ਹੈ, ਜੋ ਕਿ ਕੁਝ ਫੈਸਲੇ ਇਸ ਦੀ ਸਮੱਗਰੀ ਦੇ ਆਧਾਰ 'ਤੇ ਕੀਤੀ ਰਹੇ ਹਨ. ਦਾ ਕਹਿਣਾ ਹੈ ਕਿ ਤੁਹਾਨੂੰ anatom ਕਹਿੰਦੇ ਸਾਰੀ ਡਾਇਰੈਕਟਰੀ ਦਿਖਾ ਵੱਖ ਕਰਨ ਚਾਹੁੰਦੇ ਹੋ. ਇਹ ਅਜਿਹੇ ਨਿਯਮ ਦਾ ਨੁਸਖ਼ਾ ਕਰਨ ਲਈ ਕਾਫ਼ੀ ਹੈ:
ਯੂਜ਼ਰ-ਏਜੰਟ: Googlebot
ਅਸਵੀਕਾਰ: / anatom
ਕੀ, ਉਦਾਹਰਨ ਲਈ, ਤੁਹਾਨੂੰ ਨਾ ਇੰਡੈਕਸ ਨੂੰ ਸਭ ਚਿੱਤਰ ਕਿਸਮ .gif ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ. ਇਹ ਕਰਨ ਲਈ, ਹੇਠ ਦਿੱਤੀ ਸੂਚੀ ਵਿੱਚ ਸ਼ਾਮਿਲ ਕਰੋ:
ਯੂਜ਼ਰ-ਏਜੰਟ: Googlebot
ਅਸਵੀਕਾਰ: /*.gif$
ਇੱਥੇ ਇੱਕ ਹੋਰ ਉਦਾਹਰਨ ਹੈ. ਆਓ ਨੇ, ਆਰਜੀ ਪੈਦਾ ਸਫ਼ੇ 'ਤੇ ਜਾਣਕਾਰੀ ਨੂੰ ਪਾਰਸ ਤੱਕ ਹਟਾ ਦਿੱਤਾ ਹੈ, ਜਦਕਿ ਦਾ ਸੂਚਕ ਇੰਦਰਾਜ਼ ਦੀ ਕਿਸਮ ਨੂੰ ਸ਼ਾਮਿਲ ਕਰਨ ਲਈ:
ਯੂਜ਼ਰ-ਏਜੰਟ: Googlebot
ਅਸਵੀਕਾਰ: / *?
ਜੋ ਕਿ ਦੇ ਬਾਰੇ ਹੈ, ਅਤੇ ਖੋਜ ਇੰਜਣ ਲਈ ਨਿਯਮ ਵੀ ਜ਼ਿਕਰ ਕੀਤਾ. ਇਕ ਹੋਰ ਗੱਲ ਇਹ ਹੈ ਕਿ ਇਸ ਨੂੰ ਹੋਰ ਬਹੁਤ ਕੁਝ ਨੂੰ ਸਿਰਫ ਇਸ ਮੈਟਾ ਟੈਗ ਵਰਤਣ ਲਈ ਸੌਖਾ ਹੈ. ਅਤੇ webmasters ਅਕਸਰ ਅਜਿਹਾ ਹੀ ਇੱਕ ਮਿਆਰੀ ਖੋਜ ਇੰਜਣ ਦੀ ਕਾਰਵਾਈ ਦਾ ਪ੍ਰਬੰਧ ਕਰਨ ਲਈ ਵਰਤ. ਪਰ ਸਾਨੂੰ ਭਵਿੱਖ ਲੇਖ ਵਿਚ ਇਸ ਬਾਰੇ ਚਰਚਾ ਲੱਗੇਗਾ.
Similar articles
Trending Now