Role & seniority: LLM – AI Quality Analyst (Personalization); short-term contract (2 months), immediate start

Stack/tools: Thai reading/writing proficiency; data annotation and AI quality evaluation; creative prompt engineering; multi-turn prompts (1–5 turns); side-by-side (SxS) evaluation; “Debug Info” extraction; data hygiene practices; remote work; primary Google account for data sources (required)

Top 3 responsibilities

Design 1–5 turn personalized prompts using user context and evaluate grounded, helpful AI responses
Conduct SxS comparisons, identify personalization errors, reasoning gaps, and grounding issues
Write clear, structured rationales tied to specific turns; verify data source usage; maintain deletion of evaluation conversations

Must-have skills

Thai proficiency (reading/writing)
Experience in data annotation, AI quality evaluation, content moderation, or related roles
Strong analytical skills for nuanced AI outputs; attention to detail for SxS comparisons
Experience with multi-turn prompts, personalization concepts, and feedback/documentation
Excellent written communication; independent, self-motivated remote work
BS/BA or equivalent in a relevant field; reliable internet and device

Nice-to-haves

Prior experience with debugging/verification of data provenance
Familiarity with privacy/data hygiene practices in evaluations
Location & work type: Remote (global), 30–40 hours/week, overlapping 4 hours with

Full Description

Position: LLM – AI Quality Analyst (Personalization) – Thai

Type: Short-Term Contract

Location: Remote

Commitment: 30–40 hours/week, 4-hour overlap with PST

Engagement Length: 2 months

Start Date: Immediate

Role Responsibilities

Design multi-turn conversational prompts (1–5 turns) using personal context Evaluate personalized AI responses for grounding, integration, and helpfulness Assess correct usage of personal data and identify flawed inferences or hallucinations Review integration quality to ensure personalization feels natural and not over-narrated Conduct side-by-side (SxS) evaluation and ranking of model responses Identify personalization errors, reasoning gaps, and grounding issues Write clear, structured rationales referencing specific conversation turns Extract and verify “Debug Info” to confirm correct data source utilization Maintain strict data hygiene by deleting evaluation conversations

Requirements

Thai proficiency (reading and writing) Strong experience in data annotation, AI quality evaluation, content moderation, or related roles Strong analytical skills for evaluating nuanced and ambiguous AI outputs Experience with creative prompt engineering and multi-turn conversations Understanding of personalization concepts and AI response evaluation High attention to detail for SxS comparisons Excellent written communication and feedback documentation skills BS/BA degree or equivalent experience in a relevant field Willingness to use a primary personal Google account with enabled personal data sources Self-motivated and able to work independently in a remote setup Desktop/laptop with reliable internet connection

Application Process

Fill out the application form Complete the ICF Complete the assessment

Quality Assurance Specialist (Thai) | $11/hr Remote

Top 3 responsibilities

Must-have skills

Nice-to-haves

Full Description