cloudstream-extensions-hexated/lib/proxytranslate.py

# based on https://github.com/MrCl0wnLab/ProxyGoogleTranslate
import sys
if sys.version_info[0] >= 3:
    from urllib import request
    import urllib.parse as urlparse
    PY3 = True
else:
    PY3 = False
    import urllib as request
    import urlparse

import re
import time
import requests
try:
    from platformcode import logger
except ImportError:
    logger = None

HEADERS = {'User-Agent': 'android',
           "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8",
           "Accept-Language": "it-IT,it;q=0.8,en-US;q=0.5,en;q=0.3", "Accept-Charset": "UTF-8",
           "Accept-Encoding": "gzip"}

SL = 'en'
TL = 'it'

BASE_URL_PROXY = 'https://translate.googleusercontent.com'
BASE_URL_TRANSLATE = 'https://translate.google.com/translate?hl=it&sl=' + SL + '&tl=' + TL + '&u=[TARGET_URL]'  # noqa: E501


def checker_url(html, url):
    grep_regex = re.findall(r'(?:href="|src="|value=")(https?://translate[^"]+)', html)  # noqa: E501
    for url_result_regex in grep_regex:
        if url in url_result_regex:
            return url_result_regex.replace('&amp;', '&')


def process_request_proxy(url):
    if not url:
        return

    try:
        domain = urlparse.urlparse(url).netloc
        session = requests.Session()
        session.headers.update(HEADERS)

        target_url = \
            BASE_URL_TRANSLATE.replace('[TARGET_URL]', request.quote(url))

        if logger:
            logger.debug(target_url)
        else:
            print(target_url)

        result = session.get(target_url, timeout=5)
        if not result:
            return
        data = result.text
        # logger.debug(data)
        if '<title>Google Traduttore' in data:
            url_request = checker_url(
                result.text,
                BASE_URL_PROXY + '/translate_p?hl=it&sl=' + SL + '&tl=' + TL + '&u='
            )

            if logger:
                logger.debug(url_request)
            else:
                print(url_request)

            request_final = session.get(
                url_request,
                timeout=5
            )

            url_request_proxy = checker_url(
                request_final.text, 'translate.google')

            if logger:
                logger.debug(url_request_proxy)
            else:
                print(url_request_proxy)

            data = None
            result = None
            while not data or 'Sto traducendo' in data:
                time.sleep(0.5)
                result = session.get(
                    url_request_proxy,
                    timeout=5
                )
                data = result.text
                if logger:
                    logger.debug(url_request_proxy)

        data = re.sub('\s(\w+)=(?!")([^<>\s]+)', r' \1="\2"', data)
        data = re.sub('https://translate\.googleusercontent\.com/.*?u=(.*?)&amp;usg=[A-Za-z0-9_-]+', '\\1', data)
        data = re.sub('https?://[a-zA-Z0-9-]*' + domain.replace('.', '-') + '\.translate\.goog(/[a-zA-Z0-9#/-]+)', 'https://' + domain + '\\1', data)
        data = re.sub('\s+<', '<', data)
        data = data.replace('&amp;', '&').replace('https://translate.google.com/website?sl=' + SL + '&tl=' + TL + '&ajax=1&u=', '')

        return {'url': url.strip(), 'result': result, 'data': data}
    except Exception as e:
        if logger:
            logger.error(e)
        else:
            print(e)
testing auto redirect links 2022-11-05 02:45:40 +00:00			`# based on https://github.com/MrCl0wnLab/ProxyGoogleTranslate`
			`import sys`
			`if sys.version_info[0] >= 3:`
			`from urllib import request`
			`import urllib.parse as urlparse`
			`PY3 = True`
			`else:`
			`PY3 = False`
			`import urllib as request`
			`import urlparse`

			`import re`
			`import time`
			`import requests`
			`try:`
			`from platformcode import logger`
			`except ImportError:`
			`logger = None`

			`HEADERS = {'User-Agent': 'android',`
			`"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,/;q=0.8",`
			`"Accept-Language": "it-IT,it;q=0.8,en-US;q=0.5,en;q=0.3", "Accept-Charset": "UTF-8",`
			`"Accept-Encoding": "gzip"}`

			`SL = 'en'`
			`TL = 'it'`

			`BASE_URL_PROXY = 'https://translate.googleusercontent.com'`
			`BASE_URL_TRANSLATE = 'https://translate.google.com/translate?hl=it&sl=' + SL + '&tl=' + TL + '&u=[TARGET_URL]' # noqa: E501`


			`def checker_url(html, url):`
			`grep_regex = re.findall(r'(?:href="\|src="\|value=")(https?://translate[^"]+)', html) # noqa: E501`
			`for url_result_regex in grep_regex:`
			`if url in url_result_regex:`
			`return url_result_regex.replace('&', '&')`


			`def process_request_proxy(url):`
			`if not url:`
			`return`

			`try:`
			`domain = urlparse.urlparse(url).netloc`
			`session = requests.Session()`
			`session.headers.update(HEADERS)`

			`target_url = \`
			`BASE_URL_TRANSLATE.replace('[TARGET_URL]', request.quote(url))`

			`if logger:`
			`logger.debug(target_url)`
			`else:`
			`print(target_url)`

			`result = session.get(target_url, timeout=5)`
			`if not result:`
			`return`
			`data = result.text`
			`# logger.debug(data)`
			`if '<title>Google Traduttore' in data:`
			`url_request = checker_url(`
			`result.text,`
			`BASE_URL_PROXY + '/translate_p?hl=it&sl=' + SL + '&tl=' + TL + '&u='`
			`)`

			`if logger:`
			`logger.debug(url_request)`
			`else:`
			`print(url_request)`

			`request_final = session.get(`
			`url_request,`
			`timeout=5`
			`)`

			`url_request_proxy = checker_url(`
			`request_final.text, 'translate.google')`

			`if logger:`
			`logger.debug(url_request_proxy)`
			`else:`
			`print(url_request_proxy)`

			`data = None`
			`result = None`
			`while not data or 'Sto traducendo' in data:`
			`time.sleep(0.5)`
			`result = session.get(`
			`url_request_proxy,`
			`timeout=5`
			`)`
			`data = result.text`
			`if logger:`
			`logger.debug(url_request_proxy)`

			`data = re.sub('\s(\w+)=(?!")([^<>\s]+)', r' \1="\2"', data)`
			`data = re.sub('https://translate\.googleusercontent\.com/.?u=(.?)&usg=[A-Za-z0-9_-]+', '\\1', data)`
			`data = re.sub('https?://[a-zA-Z0-9-]*' + domain.replace('.', '-') + '\.translate\.goog(/[a-zA-Z0-9#/-]+)', 'https://' + domain + '\\1', data)`
			`data = re.sub('\s+<', '<', data)`
			`data = data.replace('&', '&').replace('https://translate.google.com/website?sl=' + SL + '&tl=' + TL + '&ajax=1&u=', '')`

			`return {'url': url.strip(), 'result': result, 'data': data}`
			`except Exception as e:`
			`if logger:`
			`logger.error(e)`
			`else:`
			`print(e)`