Untitled

 avatar
unknown
python
3 days ago
699 B
2
Indexable
def chunk_text(text, chunk_size=512):
    """
    Dzieli tekst na fragmenty o określonej wielkości.

    Args:
        text (str): Tekst do podzielenia.
        chunk_size (int): Wielkość fragmentu (w tokenach).

    Returns:
        list: Lista fragmentów tekstu.
    """

    tokens = text.split()  # Prosta tokenizacja (podział na słowa)
    chunks = []
    for i in range(0, len(tokens), chunk_size):
        chunk = ' '.join(tokens[i:i + chunk_size])
        chunks.append(chunk)
    return chunks

text = """
Długi tekst do podzielenia na fragmenty.
...
"""

chunks = chunk_text(text, chunk_size=100)
for chunk in chunks:
    print(chunk)
    print("-" * 20)
Editor is loading...
Leave a Comment