Pathway

PathwayReader #

基类: BaseReader

Pathway 阅读器。

从 Pathway 数据索引管道检索文档。

参数

名称	类型	描述	默认值
`host`	`str`	Pathway 当前托管的 URI。	`无`
`port`	`str \| int`	Pathway 监听的端口号。	`无`

另请参阅

llamaindex.retriever.pathway.PathwayRetriever 和 llamaindex.retriever.pathway.PathwayVectorServer

源码位于 llama-index-integrations/readers/llama-index-readers-pathway/llama_index/readers/pathway/base.py

class PathwayReader(BaseReader):
    """
    Pathway reader.

    Retrieve documents from Pathway data indexing pipeline.

    Args:
        host (str): The URI where Pathway is currently hosted.
        port (str | int): The port number on which Pathway is listening.

    See Also:
        llamaindex.retriever.pathway.PathwayRetriever and,
        llamaindex.retriever.pathway.PathwayVectorServer

    """

    def __init__(
        self,
        host: Optional[str] = None,
        port: Optional[int] = None,
        url: Optional[str] = None,
    ):
        """Initializing the Pathway reader client."""
        self.client = _VectorStoreClient(host, port, url)

    def load_data(
        self,
        query_text: str,
        k: Optional[int] = 4,
        metadata_filter: Optional[str] = None,
    ) -> List[Document]:
        """
        Load data from Pathway.

        Args:
            query_text (str): The text to get the closest neighbors of.
            k (int): Number of results to return.
            metadata_filter (str): Filter to be applied.

        Returns:
            List[Document]: A list of documents.

        """
        results = self.client(query_text, k, metadata_filter)
        documents = []
        for return_elem in results:
            document = Document(
                text=return_elem["text"],
                extra_info=return_elem["metadata"],
            )

            documents.append(document)

        return documents

load_data #

load_data(query_text: str, k: Optional[int] = 4, metadata_filter: Optional[str] = None) -> List[Document]

从 Pathway 加载数据。

参数

名称	类型	描述	默认值
`query_text`	`str`	获取最近邻居的文本。	必需
`k`	`int`	返回结果数量。	`4`
`metadata_filter`	`str`	要应用的过滤器。	`无`

返回

类型	描述
`List[Document]`	List[Document]: 文档列表。

源码位于 llama-index-integrations/readers/llama-index-readers-pathway/llama_index/readers/pathway/base.py

def load_data(
    self,
    query_text: str,
    k: Optional[int] = 4,
    metadata_filter: Optional[str] = None,
) -> List[Document]:
    """
    Load data from Pathway.

    Args:
        query_text (str): The text to get the closest neighbors of.
        k (int): Number of results to return.
        metadata_filter (str): Filter to be applied.

    Returns:
        List[Document]: A list of documents.

    """
    results = self.client(query_text, k, metadata_filter)
    documents = []
    for return_elem in results:
        document = Document(
            text=return_elem["text"],
            extra_info=return_elem["metadata"],
        )

        documents.append(document)

    return documents