- Exact Code Search: Find code faster across repositories
GitLabが開発した新しいコード検索手法で、トークン化ではなく3文字の「トライグラム」を使用することで、正規表現を内部でトライグラム検索に変換し、コード検索を効率化しています。
- Pattern machines that we don’t understand
Lorin Hochsteinによる記事で、LLM(大規模言語モデル)の内部構造や挙動について考察しています。SREに直接関連しませんが、システムの理解や信頼性に関する洞察を提供しています。
- Soft vs. Hard Dependency: A Better Way to Think About Dependencies for More Reliable Systems
Teiva Harsanyiが、ソフト依存とハード依存の違いを説明し、依存関係の理解がシステムの信頼性向上にどのように寄与するかを論じています。
- Breaking up a monolith: How we’re unwinding a shared database at scale
DatadogのFabiana ScalaとTali Gutmanが、共有データベースを独立したインスタンスに分割するプロセスを紹介し、境界の定義、移行時のリスク最小化、ツールの構築方法について詳述しています。
- Big Enough to Fail
Will Gallegoが、大手テック企業(例:Google CloudやSalesforce)の障害に対する寛容度と、それが信頼性工学やインシデント対応に与える影響について考察しています。
- Use AWS FIS to test the resilience of self-managed Cassandra
AWSのHans NesbittとLwanga Phillipが、AWS Fault Injection Service(FIS)を使用して、自己管理型Cassandraクラスタの耐障害性をテストする実践的なガイドを提供しています。
- Building a Billing Usage Recovery System
KlaviyoのKaavya Antonyが、S3とSQSを活用して、請求使用状況の追跡失敗を自動的に回復するシステムを構築した方法を紹介しています。
- Taming Complexity: HelloFresh’s Playbook for Managing Large-Scale Change (Part 3/3)
HelloFreshのKonstantin Rohlederが、大規模な変更を管理するための4段階のフレームワークを紹介し、人、プロセス、コードの側面からのアプローチをまとめています。