diff --git a/Cargo.toml b/Cargo.toml
index c66ba1fc..f2a47673 100644
--- a/Cargo.toml
+++ b/Cargo.toml
@@ -64,3 +64,4 @@ tokio = { version = "1", features = ["sync", "rt-multi-thread", "macros"] }
 name = "failpoint_tests"
 path = "tests/failpoint_tests.rs"
 required-features = ["fail/failpoints"]
+
diff --git a/src/pd/timestamp.rs b/src/pd/timestamp.rs
index a1cc7fbd..24e68205 100644
--- a/src/pd/timestamp.rs
+++ b/src/pd/timestamp.rs
@@ -13,6 +13,8 @@
 
 use std::collections::VecDeque;
 use std::pin::Pin;
+use std::sync::atomic::AtomicBool;
+use std::sync::atomic::Ordering;
 use std::sync::Arc;
 
 use futures::pin_mut;
@@ -21,7 +23,7 @@ use futures::task::AtomicWaker;
 use futures::task::Context;
 use futures::task::Poll;
 use log::debug;
-use log::info;
+use log::warn;
 use pin_project::pin_project;
 use tokio::sync::mpsc;
 use tokio::sync::oneshot;
@@ -31,6 +33,7 @@ use tonic::transport::Channel;
 use crate::internal_err;
 use crate::proto::pdpb::pd_client::PdClient;
 use crate::proto::pdpb::*;
+use crate::stats::observe_tso_batch;
 use crate::Result;
 
 /// It is an empirical value.
@@ -57,8 +60,13 @@ impl TimestampOracle {
         let pd_client = pd_client.clone();
         let (request_tx, request_rx) = mpsc::channel(MAX_BATCH_SIZE);
 
-        // Start a background thread to handle TSO requests and responses
-        tokio::spawn(run_tso(cluster_id, pd_client, request_rx));
+        // Start a background task to handle TSO requests and responses.
+        // If it exits with an error, log it explicitly so root cause is preserved.
+        tokio::spawn(async move {
+            if let Err(err) = run_tso(cluster_id, pd_client, request_rx).await {
+                warn!("TSO background task exited with error: {:?}", err);
+            }
+        });
 
         Ok(TimestampOracle { request_tx })
     }
@@ -86,29 +94,47 @@ async fn run_tso(
     // more requests from the bounded channel. This waker is used to wake up the sending future
     // if the queue containing pending requests is no longer full.
     let sending_future_waker = Arc::new(AtomicWaker::new());
+    // This flag indicates the sender stream could not acquire `pending_requests` lock in poll
+    // and needs an explicit wake from the response path.
+    let sender_waiting_on_lock = Arc::new(AtomicBool::new(false));
 
     let request_stream = TsoRequestStream {
         cluster_id,
         request_rx,
         pending_requests: pending_requests.clone(),
         self_waker: sending_future_waker.clone(),
+        sender_waiting_on_lock: sender_waiting_on_lock.clone(),
     };
 
     // let send_requests = rpc_sender.send_all(&mut request_stream);
     let mut responses = pd_client.tso(request_stream).await?.into_inner();
 
-    while let Some(Ok(resp)) = responses.next().await {
-        {
+    while let Some(resp) = responses.next().await {
+        let resp = resp?;
+        let should_wake_sender = {
             let mut pending_requests = pending_requests.lock().await;
+            let was_full = pending_requests.len() >= MAX_PENDING_COUNT;
             allocate_timestamps(&resp, &mut pending_requests)?;
-        }
+            was_full && pending_requests.len() < MAX_PENDING_COUNT
+        };
+        let sender_blocked_by_lock = sender_waiting_on_lock.swap(false, Ordering::SeqCst);
 
-        // Wake up the sending future blocked by too many pending requests or locked.
-        sending_future_waker.wake();
+        // Wake sender when:
+        // 1. a previously full queue gains capacity, or
+        // 2. sender was blocked on `pending_requests` mutex contention.
+        if should_wake_sender || sender_blocked_by_lock {
+            sending_future_waker.wake();
+        }
+    }
+    let pending_count = pending_requests.lock().await.len();
+    if pending_count == 0 {
+        Ok(())
+    } else {
+        Err(internal_err!(
+            "TSO stream terminated with {} pending requests",
+            pending_count
+        ))
     }
-    // TODO: distinguish between unexpected stream termination and expected end of test
-    info!("TSO stream terminated");
-    Ok(())
 }
 
 struct RequestGroup {
@@ -123,6 +149,7 @@ struct TsoRequestStream {
     request_rx: mpsc::Receiver<oneshot::Sender<Timestamp>>,
     pending_requests: Arc<Mutex<VecDeque<RequestGroup>>>,
     self_waker: Arc<AtomicWaker>,
+    sender_waiting_on_lock: Arc<AtomicBool>,
 }
 
 impl Stream for TsoRequestStream {
@@ -135,9 +162,20 @@ impl Stream for TsoRequestStream {
         pin_mut!(pending_requests);
         let mut pending_requests = if let Poll::Ready(pending_requests) = pending_requests.poll(cx)
         {
+            this.sender_waiting_on_lock.store(false, Ordering::SeqCst);
             pending_requests
         } else {
+            // Lock is held by the response path. Register waker first so any
+            // subsequent wake() targets the correct waker, then advertise that
+            // we are waiting.
             this.self_waker.register(cx.waker());
+            this.sender_waiting_on_lock.store(true, Ordering::SeqCst);
+            // If the response path cleared the flag between our register and
+            // store, its wake may have targeted a stale waker. Self-wake to
+            // guarantee we get re-polled.
+            if !this.sender_waiting_on_lock.load(Ordering::SeqCst) {
+                cx.waker().wake_by_ref();
+            }
             return Poll::Pending;
         };
         let mut requests = Vec::new();
@@ -153,6 +191,7 @@ impl Stream for TsoRequestStream {
         }
 
         if !requests.is_empty() {
+            observe_tso_batch(requests.len());
             let req = TsoRequest {
                 header: Some(RequestHeader {
                     cluster_id: *this.cluster_id,
@@ -170,9 +209,11 @@ impl Stream for TsoRequestStream {
 
             Poll::Ready(Some(req))
         } else {
-            // Set the waker to the context, then the stream can be waked up after the pending queue
-            // is no longer full.
-            this.self_waker.register(cx.waker());
+            // Register self waker only when blocked by a full pending queue.
+            // When queue is not full, poll_recv above has already registered the receiver waker.
+            if pending_requests.len() >= MAX_PENDING_COUNT {
+                this.self_waker.register(cx.waker());
+            }
             Poll::Pending
         }
     }
@@ -216,3 +257,322 @@ fn allocate_timestamps(
     };
     Ok(())
 }
+
+#[cfg(test)]
+mod tests {
+    use std::sync::atomic::AtomicUsize;
+    use std::sync::Arc;
+
+    use futures::executor::block_on;
+    use futures::task::noop_waker_ref;
+    use futures::task::waker;
+    use futures::task::ArcWake;
+
+    use super::*;
+
+    struct WakeCounter {
+        wakes: AtomicUsize,
+    }
+
+    impl ArcWake for WakeCounter {
+        fn wake_by_ref(arc_self: &Arc<Self>) {
+            arc_self.wakes.fetch_add(1, Ordering::SeqCst);
+        }
+    }
+
+    fn test_tso_request(count: u32) -> TsoRequest {
+        TsoRequest {
+            header: Some(RequestHeader {
+                cluster_id: 1,
+                sender_id: 0,
+            }),
+            count,
+            dc_location: String::new(),
+        }
+    }
+
+    fn test_tso_response(count: u32, logical: i64) -> TsoResponse {
+        TsoResponse {
+            header: None,
+            count,
+            timestamp: Some(Timestamp {
+                physical: 123,
+                logical,
+                suffix_bits: 0,
+            }),
+        }
+    }
+
+    type TestStreamContext = (
+        TsoRequestStream,
+        mpsc::Sender<TimestampRequest>,
+        Arc<Mutex<VecDeque<RequestGroup>>>,
+        Arc<AtomicWaker>,
+        Arc<AtomicBool>,
+    );
+
+    fn new_test_stream() -> TestStreamContext {
+        let (request_tx, request_rx) = mpsc::channel(MAX_BATCH_SIZE);
+        let pending_requests = Arc::new(Mutex::new(VecDeque::new()));
+        let self_waker = Arc::new(AtomicWaker::new());
+        let sender_waiting_on_lock = Arc::new(AtomicBool::new(false));
+        let stream = TsoRequestStream {
+            cluster_id: 1,
+            request_rx,
+            pending_requests: pending_requests.clone(),
+            self_waker: self_waker.clone(),
+            sender_waiting_on_lock: sender_waiting_on_lock.clone(),
+        };
+        (
+            stream,
+            request_tx,
+            pending_requests,
+            self_waker,
+            sender_waiting_on_lock,
+        )
+    }
+
+    #[test]
+    fn allocate_timestamps_successfully_assigns_monotonic_timestamps() {
+        let (tx1, rx1) = oneshot::channel();
+        let (tx2, rx2) = oneshot::channel();
+        let (tx3, rx3) = oneshot::channel();
+        let mut pending_requests = VecDeque::new();
+        pending_requests.push_back(RequestGroup {
+            tso_request: test_tso_request(3),
+            requests: vec![tx1, tx2, tx3],
+        });
+
+        allocate_timestamps(&test_tso_response(3, 100), &mut pending_requests).unwrap();
+        assert!(pending_requests.is_empty());
+
+        let ts1 = block_on(rx1).unwrap();
+        let ts2 = block_on(rx2).unwrap();
+        let ts3 = block_on(rx3).unwrap();
+        assert_eq!(ts1.logical, 98);
+        assert_eq!(ts2.logical, 99);
+        assert_eq!(ts3.logical, 100);
+    }
+
+    #[test]
+    fn allocate_timestamps_errors_without_timestamp() {
+        let (tx, _rx) = oneshot::channel();
+        let mut pending_requests = VecDeque::new();
+        pending_requests.push_back(RequestGroup {
+            tso_request: test_tso_request(1),
+            requests: vec![tx],
+        });
+        let resp = TsoResponse {
+            header: None,
+            count: 1,
+            timestamp: None,
+        };
+
+        let err = allocate_timestamps(&resp, &mut pending_requests).unwrap_err();
+        assert!(format!("{err:?}").contains("No timestamp in TsoResponse"));
+    }
+
+    #[test]
+    fn allocate_timestamps_errors_when_count_mismatches() {
+        let (tx, _rx) = oneshot::channel();
+        let mut pending_requests = VecDeque::new();
+        pending_requests.push_back(RequestGroup {
+            tso_request: test_tso_request(2),
+            requests: vec![tx],
+        });
+
+        let err =
+            allocate_timestamps(&test_tso_response(1, 10), &mut pending_requests).unwrap_err();
+        assert!(format!("{err:?}").contains("different number of timestamps"));
+    }
+
+    #[test]
+    fn allocate_timestamps_errors_on_extra_response() {
+        let mut pending_requests = VecDeque::new();
+        let err =
+            allocate_timestamps(&test_tso_response(1, 10), &mut pending_requests).unwrap_err();
+        assert!(format!("{err:?}").contains("more TsoResponse than expected"));
+    }
+
+    #[test]
+    fn poll_next_emits_request_and_enqueues_request_group() {
+        let (stream, request_tx, pending_requests, _self_waker, sender_waiting_on_lock) =
+            new_test_stream();
+        let (tx, _rx) = oneshot::channel();
+        request_tx.try_send(tx).unwrap();
+
+        let mut stream = Box::pin(stream);
+        let mut cx = Context::from_waker(noop_waker_ref());
+        let polled = stream.as_mut().poll_next(&mut cx);
+        let req = match polled {
+            Poll::Ready(Some(req)) => req,
+            other => panic!("expected Poll::Ready(Some(_)), got {:?}", other),
+        };
+
+        assert_eq!(req.count, 1);
+        assert!(!sender_waiting_on_lock.load(Ordering::SeqCst));
+        let queued = block_on(async { pending_requests.lock().await.len() });
+        assert_eq!(queued, 1);
+    }
+
+    #[test]
+    fn poll_next_registers_self_waker_when_pending_queue_is_full() {
+        let (stream, _request_tx, pending_requests, self_waker, _sender_waiting_on_lock) =
+            new_test_stream();
+        block_on(async {
+            let mut guard = pending_requests.lock().await;
+            for _ in 0..MAX_PENDING_COUNT {
+                guard.push_back(RequestGroup {
+                    tso_request: test_tso_request(0),
+                    requests: Vec::new(),
+                });
+            }
+        });
+
+        let wake_counter = Arc::new(WakeCounter {
+            wakes: AtomicUsize::new(0),
+        });
+        let test_waker = waker(wake_counter.clone());
+        let mut cx = Context::from_waker(&test_waker);
+        let mut stream = Box::pin(stream);
+
+        let polled = stream.as_mut().poll_next(&mut cx);
+        assert!(matches!(polled, Poll::Pending));
+        assert_eq!(wake_counter.wakes.load(Ordering::SeqCst), 0);
+
+        self_waker.wake();
+        assert_eq!(wake_counter.wakes.load(Ordering::SeqCst), 1);
+    }
+
+    #[test]
+    fn poll_next_marks_waiting_flag_when_lock_is_contended() {
+        let (stream, _request_tx, pending_requests, self_waker, sender_waiting_on_lock) =
+            new_test_stream();
+        let lock_guard = block_on(pending_requests.lock());
+
+        let wake_counter = Arc::new(WakeCounter {
+            wakes: AtomicUsize::new(0),
+        });
+        let test_waker = waker(wake_counter.clone());
+        let mut cx = Context::from_waker(&test_waker);
+        let mut stream = Box::pin(stream);
+
+        let polled = stream.as_mut().poll_next(&mut cx);
+        assert!(matches!(polled, Poll::Pending));
+        assert!(sender_waiting_on_lock.load(Ordering::SeqCst));
+
+        // Simulate response path: swap flag and wake.
+        drop(lock_guard);
+        if sender_waiting_on_lock.swap(false, Ordering::SeqCst) {
+            self_waker.wake();
+        }
+        assert!(wake_counter.wakes.load(Ordering::SeqCst) >= 1);
+    }
+
+    /// Simulate the race where the response path clears the flag *before*
+    /// poll_next sets it. The self-wake guard must fire.
+    #[test]
+    fn poll_next_self_wakes_when_flag_cleared_before_store() {
+        let (stream, _request_tx, pending_requests, _self_waker, sender_waiting_on_lock) =
+            new_test_stream();
+        // Hold lock so poll returns Pending.
+        let lock_guard = block_on(pending_requests.lock());
+
+        let wake_counter = Arc::new(WakeCounter {
+            wakes: AtomicUsize::new(0),
+        });
+        let test_waker = waker(wake_counter.clone());
+        let mut cx = Context::from_waker(&test_waker);
+        let mut stream = Box::pin(stream);
+
+        // Pre-clear the flag (simulates response path racing ahead).
+        sender_waiting_on_lock.store(false, Ordering::SeqCst);
+
+        let polled = stream.as_mut().poll_next(&mut cx);
+        assert!(matches!(polled, Poll::Pending));
+
+        // The flag should have been set to true by poll_next.
+        // Because the flag was not externally cleared *after* the store,
+        // no self-wake is needed — the flag stays true for the response path
+        // to observe normally.
+        assert!(sender_waiting_on_lock.load(Ordering::SeqCst));
+
+        drop(lock_guard);
+    }
+
+    /// Verify that after the response path clears the flag *and* we simulate
+    /// that clearing happening between register and store, the sender detects
+    /// it and self-wakes.
+    #[test]
+    fn poll_next_detects_flag_cleared_after_store_and_self_wakes() {
+        let (stream, _request_tx, pending_requests, _self_waker, sender_waiting_on_lock) =
+            new_test_stream();
+        let lock_guard = block_on(pending_requests.lock());
+
+        let wake_counter = Arc::new(WakeCounter {
+            wakes: AtomicUsize::new(0),
+        });
+        let test_waker = waker(wake_counter.clone());
+        let mut cx = Context::from_waker(&test_waker);
+        let mut stream = Box::pin(stream);
+
+        // poll_next will: register waker, store(true), then load to re-check.
+        // We can't interleave mid-poll, but we can verify the steady-state:
+        // after poll returns Pending, simulate response clearing the flag
+        // and confirm wake propagation via self_waker.
+        let polled = stream.as_mut().poll_next(&mut cx);
+        assert!(matches!(polled, Poll::Pending));
+        assert!(sender_waiting_on_lock.load(Ordering::SeqCst));
+
+        // Simulate response path: clear the flag (as if between store and load).
+        sender_waiting_on_lock.store(false, Ordering::SeqCst);
+        // The registered waker is current, so waking self_waker delivers correctly.
+        _self_waker.wake();
+        assert_eq!(wake_counter.wakes.load(Ordering::SeqCst), 1);
+
+        drop(lock_guard);
+    }
+
+    /// After acquiring the lock, the waiting flag must be cleared.
+    #[test]
+    fn poll_next_clears_waiting_flag_on_lock_acquire() {
+        let (stream, request_tx, _pending_requests, _self_waker, sender_waiting_on_lock) =
+            new_test_stream();
+        // Pre-set the flag as if a previous poll was contended.
+        sender_waiting_on_lock.store(true, Ordering::SeqCst);
+
+        let (tx, _rx) = oneshot::channel();
+        request_tx.try_send(tx).unwrap();
+
+        let mut stream = Box::pin(stream);
+        let mut cx = Context::from_waker(noop_waker_ref());
+        let polled = stream.as_mut().poll_next(&mut cx);
+        assert!(matches!(polled, Poll::Ready(Some(_))));
+        // Flag must be cleared after successful lock acquisition.
+        assert!(!sender_waiting_on_lock.load(Ordering::SeqCst));
+    }
+
+    /// When queue is not full and no requests available, poll_next should not
+    /// register the self_waker (the channel waker handles this case).
+    #[test]
+    fn poll_next_does_not_register_self_waker_when_queue_not_full() {
+        let (stream, _request_tx, _pending_requests, self_waker, _sender_waiting_on_lock) =
+            new_test_stream();
+
+        let wake_counter = Arc::new(WakeCounter {
+            wakes: AtomicUsize::new(0),
+        });
+        let test_waker = waker(wake_counter.clone());
+        let mut cx = Context::from_waker(&test_waker);
+        let mut stream = Box::pin(stream);
+
+        // No requests in channel, queue empty -> Pending.
+        let polled = stream.as_mut().poll_next(&mut cx);
+        assert!(matches!(polled, Poll::Pending));
+
+        // self_waker.wake() should NOT reach our waker because the self_waker
+        // was not registered (queue is not full).
+        self_waker.wake();
+        assert_eq!(wake_counter.wakes.load(Ordering::SeqCst), 0);
+    }
+}